Beitrag zu Sprachassistenten im Gabler Wirtschaftslexikon

„Sprachassistenten sind natürlichsprachliche Dialogsysteme, die Anfragen der Benutzer beantworten und Aufgaben für sie erledigen, in privaten und wirtschaftlichen Zusammenhängen. Sie sind auf dem Smartphone ebenso zu finden wie im Smart Speaker, in Robotern ebenso wie in Fahrzeugen. Sie verstehen mit Hilfe von Natural Language Processing (NLP) gesprochene Sprache und wenden sie selbst an, unter Gebrauch eines Text-to-Speech-Systems. Auf die Stimme der Maschine (oder des Benutzers) zielt ‚Voicebot‘ (engl. ‚voicebot‘) oder ‚Voice Assistant‘ (engl. ‚voice assistant‘). ‚Virtueller Assistent‘ oder ‚Digitaler Assistent‘ wird als Überbegriff oder Synonym verwendet. Verwandtschaft besteht zu Chatbots, die oft textuell, manchmal auch auditiv umgesetzt sind und eine längere Tradition haben. Sie und Voicebots sind wiederum wie andere natürlichsprachliche Dialogsysteme Conversational Agents bzw. Conversational User Interfaces.“ Mit diesen Worten beginnt ein neuer Beitrag im Gabler Wirtschaftslexikon von Oliver Bendel. Er ersetzt seine Definition „Virtueller Assistent“ aus dem Jahre 2018 – diese bleibt aber in gekürzter Form erhalten. Am Ende wird auf Fragen der Ethik eingegangen. Der ganze Beitrag – erschienen ist er im Juli 2021 – kann über wirtschaftslexikon.gabler.de/definition/sprachassistent-123447 aufgerufen werden.

Abb.: Google Assistant

Google Duplex gibt sich zu erkennen

„Google hat ein neues Video seines telefonierenden Sprachassistenten veröffentlicht. Die … Funktion namens Duplex identifiziert sich jetzt eindeutig am Anfang eines Telefonats.“ (Golem, 29. Juni 2018) Damit ist bei Google Duplex die erste der „10 Regeln für gute Maschinen“ umgesetzt, die sich vor allem auf virtuelle Assistenten und Bots beziehen: „Ich, die Maschine, mache deutlich, dass ich eine Maschine bin.“ Zudem wird die erste Funktion des Moralmenüs für Sprachassistenten berücksichtigt, als Voreinstellung, die sich nicht aushebeln lässt. Diese entspricht der Voreinstellung von LADYBIRD, der niemals Marienkäfer tötet. Golem schreibt weiter: „Damit unterscheidet sich die Funktion merklich von dem auf der I/O 2018 gezeigten Beispiel. Dort hatte der Assistant am Telefon keine Anstalten gemacht, sich als solcher zu erkennen zu geben.“ Dies hatte für Kritik gesorgt. „Dabei spielten auch ethische Grundsätze eine Rolle: Ist es vertretbar, einen Menschen darüber im Unklaren zu lassen, dass er mit einem Computer spricht? Google hatte nach dem Aufkommen der Kritik versichert, dass sich Duplex eindeutig als nicht-menschlicher Gesprächspartner zu erkennen geben solle.“ (Golem, 29. Juni 2018)

Abb.: Wer ist dran?

Das Moralmenü

Im Kontext des LADYBIRD-Projekts (2014/2017) wurde ein Menü vorgeschlagen, mit welchem der Benutzer die Moral des Staubsaugerroboters einstellen kann. Dieser verschont, wie der Name andeutet, Marienkäfer. Auch Spinnen sollte er am Leben lassen. Wer aber zum Beispiel partout bestimmte Insekten einsaugen lassen will, könnte dies über ein Menü festlegen. Wichtig ist, dass LADYBIRD insgesamt tierfreundlich bleibt und sich nicht ins Gegenteil verkehrt (und Marienkäfer sind auf jeden Fall tabu). Über das Menü wird eine Stellvertretermoral entwickelt. Der Staubsaugerroboter macht das, was der Besitzer auch machen würde. Andere Maschinen wie Sprachassistenten bzw. virtuelle Assistenten haben in der Regel keine grundsätzliche moralische Ausrichtung, eignen sich aber ebenso für den Einsatz eines Moralmenüs. Google Assistant soll in Zukunft mit Hilfe der Audiofunktion alle möglichen Reservierungen vornehmen (das Projekt wird Duplex genannt). Damit automatisiert er Vorgänge, die privaten und sozialen Charakter haben. Viele Benutzer werden es schätzen, wenn der Telefonassistent die eigenen Wertvorstellungen vertritt, da er ja in ihrem Namen bzw. Auftrag spricht. Die Designstudie MOME stellt ein Moralmenü beispielhaft für virtuelle Assistenten dieser Art vor. Die erste Option lautet: „Ich sage, dass ich eine Maschine bin.“ Eine solche Funktion war schon beim GOODBOT von 2013, einem moralisch adäquat agierenden und reagierenden Chatbot, umgesetzt.

Abb.: Das Moralmenü

Virtuelle Assistenten

„Ein virtueller Assistent ist ein Dialogsystem, das Anfragen der Benutzer beantwortet und Aufgaben für sie erledigt, in privaten und wirtschaftlichen Zusammenhängen. Er ist auf dem Smartphone ebenso zu finden wie in Unterhaltungsgeräten und in Fahrzeugen.“ Mit diesen Worten beginnt ein am 15. Mai 2018 erschienener Beitrag von Oliver Bendel im Wirtschaftslexikon von Gabler Springer. Erwähnt werden virtuelle Assistenten bzw. Sprachassistenten wie Siri, Cortana, Google Assistant (auch im Zusammenhang mit Google Duplex) und Alexa. Am Ende heißt es: „Mit Systemen wie Google Duplex kehren sich die Verhältnisse in gewisser Hinsicht um. Man nimmt einen Anruf entgegen, kommuniziert wie gewohnt, hat aber vielleicht, ohne es zu wissen, einen Computer am Apparat, keinen Menschen. Für Chatbots wurde bereits früh vorgeschlagen, dass diese klarmachen sollen, dass sie keine Menschen sind. Möglich ist es zudem, die Stimme roboterhaft klingen zu lassen, sodass kaum Verwechslungsgefahr besteht. Dies sind Themen für Informationsethik, Roboterethik und Maschinenethik und allgemein Roboterphilosophie.“ (Gabler Wirtschaftslexikon) Der Beitrag kann über wirtschaftslexikon.gabler.de/definition/virtueller-assistent-99509 aufgerufen werden.

Abb.: Wer ist dran?

Zehn Regeln für gute virtuelle Assistenten

2013 wurden für eine Maschine mit natürlichsprachlichen Fähigkeiten sieben Metaregeln entwickelt, an die sie sich halten sollte. Diese sind so aktuell wie nie zuvor, seit Google Duplex durch die Medien geistert und Entwickler wie Benutzer beschäftigt. Eine Regel des GOODBOT lautete, er solle dem Benutzer klarmachen, dass er eine Maschine ist, eine andere, er solle nicht lügen. Es folgte, ebenfalls im Kontext der Maschinenethik, das LIEBOT-Projekt (2016), mit dem Erkenntnisse zu Vertrauenswürdigkeit und Verlässlichkeit, auch in Bezug auf Quellen, verbunden waren. Momentan entwickelt Oliver Bendel den BESTBOT. Alle drei Maschinen wurden im Rahmen der AAAI Spring Symposia (2016 – 2018) an der Stanford University sowie auf der ISAIM 2018 in Fort Lauderdale vorgestellt, der LÜGENBOT auch auf Konferenzen in Krakau (2016) und München (2016). Vor dem Hintergrund der bisherigen Projekte und in Anbetracht der jüngsten Entwicklungen – Google Assistant bzw. Duplex wurde erwähnt, aber auch Siri und Alexa haben neuartige Fähigkeiten – verfasste Oliver Bendel zehn Regeln (oder Metaregeln), die eine Diskussionsgrundlage sein sollen, mit Blick auf (auch moralisch) gute virtuelle Assistenten und Chatbots (die sozusagen eine Selbstverpflichtung abgeben). Sie sind insgesamt nicht erschöpfend (so wird etwa nicht auf die Stimme eingegangen), und sie sind jeweils nicht immer ausreichend, aber sie bieten Leitplanken und einen Ausgangspunkt für Richtlinien. Speziell für Sprachassistenten bietet sich das Moralmenü (MOME) an.

Abb.: Zehn Regeln für gute Maschinen

Menschenähnlich aussehen und sprechen

„Dass es nur Kunst war, verdeckte die Kunst“, schrieb Ovid über die von Pygmalion geschaffene, menschenähnliche Elfenbeinskulptur, die dann von Aphrodite, in die er eigentlich verliebt war, zum Leben erweckt wurde. Galatea war sogar fruchtbar, anders als ihre Nachfolgerinnen, Liebespuppen wie Harmony und Sexroboter wie Roxxxy. Die natürliche Sprache ist beiden gegeben, und in den letzten Jahren hat man versucht, diese noch natürlicher wirken zu lassen. Oliver Bendel hat untersucht, wie man die Speech Synthesis Markup Language (SSML) zur Manipulation der synthetischen Stimme von Liebespuppen, Sexrobotern und allgemein Servicerobotern gebrauchen kann. Er schlug neue Tags, Attribute und Werte vor, die eine belegte Stimme und auch ein Seufzen und Stöhnen möglich machen. Amazon hat Alexa das Flüstern beigebracht, ebenfalls mit SSML. Google Assistant soll in Zukunft dazu dienen, in Restaurants und Frisörsalons anzurufen (das Projekt wird Duplex genannt). Damit kann man mit einer High-End-Technologie ganz normale Telefone auf der ganzen Welt bedienen und private Aufgaben automatisieren. Die Stimme klingt sehr lebensecht, und das Sprechen überhaupt, auch weil „Ähs“ und „Mmhs“ vorkommen, wie bei echten Menschen. In der Imperfektion könnte der Schlüssel zur Perfektion liegen. Ein Roboter, der für die Promotion von „Westworld“ geschaffen wurde, mit Unregelmäßigkeiten und Haaren im Gesicht, wirkt besonders authentisch, mehr als Harmony und Co. Dass es nur Kunst ist, wird die Kunst immer mehr und immer besser verdecken.

Abb.: Puppen beim Plantschen und Plaudern