Der Diebstahl der Stimme

Erneut berichten Schweizer Medien über Trickbetrug mit synthetisierten Stimmen lebender Personen. Die Basler Zeitung interviewte am 7. August 2023 Prof. Dr. Oliver Bendel dazu, wie solche synthetischen Stimmen entstehen. Er forscht seit einem Vierteljahrhundert zu KI-Systemen und Robotern und seit sieben Jahren speziell auch zu synthetischen Stimmen. Grundsätzlich werden in solchen Fällen neuronale Netzwerke benutzt. Man kann sie mit der individuellen Stimme trainieren. Dafür braucht es 15 – 30 Minuten an Material. Die Zeit verkürzt sich auf wenige Sekunden, wenn man vorher ein Sprachmodell mit einigen tausend Stimmen trainiert hat und einige Voraussetzungen erfüllt sind. Zu diesen Voraussetzungen gehört, dass die individuelle Stimme einen Verwandten im Trainingsmaterial hat. Die Resultate können so oder so täuschend echt sein. Oft sind aber nicht die gewohnten Hintergrundgeräusche vorhanden, oder es fehlen typische Verhaltensweisen der Person, etwa das Nasehochziehen oder ein Stühlerücken. Es lohnt sich also, gut hinzuhören und im Zweifel auch einen Rückruf zu verlangen. Mehrere Aussagen aus dem Interview wurden in den Beitrag „Betrüger können mit KI die Stimmen lebender Personen imitieren“ aufgenommen, der am 9. August 2023 in der gedruckten Ausgabe der Basler Zeitung erschien. Bereits am Vortag war er in die Onlineauftritte von Tamedia aufgenommen worden.

Abb.: Stimmen kann man an vielen Orten stehlen

Verführerische Stimmen

Choices war im Gespräch mit Prof. Dr. Oliver Bendel, Technikphilosoph, Informations- und Maschinenethiker aus Zürich. Es ging um Serviceroboter und um soziale Roboter, um das Verhältnis zu ihnen und die Beziehungen mit ihnen. Auch die Stimmen von Robotern und Sprachassistenten waren ein Thema. Die Stimme allein hat eine große Anziehungskraft und bringt uns dazu, uns in jemanden oder etwas zu verlieben. 1989 startete das Magazin als Filmkunstmagazin in Köln. Heute wird es laut Website auch gerne gelesen im Kölner Umland, in Leverkusen und in Bonn. Zugleich hat es sich thematisch erweitert und gewandelt. Es versteht sich als ein breit aufgestelltes Kulturmagazin entwickelt, ohne dass das Augenmerk auf Filmkunst vernachlässigt werde. „Seit gut einem Jahr wurde choices erweitert durch Beiträge zu streitbaren Themen, wie z.B. das Juni-Thema EUROPA IN KÖLN.“ (Website choices.de) Das Interview mit dem Titel „Wir werden Menschen an Androiden verlieren“ ist am 25. Juli 2022 in der Onlineausgabe erschienen. Zusätzlich gibt es eine kürzere Version in der Printausgabe.

Abb.: Harmonys Stimme hat einen schottischen Akzent

Die Kombination von Puppe und Frau

„In Berlin gibt es ein Bordell nur mit Sexpuppen. Auf Wunsch mit Sprache … dann sitzt eine Frau im Nachbarszimmer. Und gibt der Puppe eine Stimme …“ Mit diesen Worten wandte sich die BILD am 3. Mai 2022 an den Informations- und Maschinenethiker und Wirtschaftsinformatiker Oliver Bendel aus Zürich. Er meinte dazu: „Dieser Fall – die Kombination von Puppe und Frau – ist hochinteressant. In gewisser Weise kommen Telefonsex und Liebespuppe zusammen. Man hat einen künstlichen Körper im Arm und eine menschliche Stimme im Ohr. Man kann das einen neuartigen Cyborg nennen, oder auch einen umgedrehten Cyborg, denn die Grundlage ist ein Artefakt. Das erinnert mich übrigens an die Umarmungspuppe Hugvie, die ich auch im Büro als Anschauungsobjekt habe. Hugvie hat eine Tasche am Kopf, in die das Smartphone reinkommt. Man telefoniert mit seinen Liebsten – Verwandten oder Freunden – und umarmt zugleich die Puppe. Grundsätzlich ist zwischen Sex- oder Liebespuppen auf der einen Seite und Sexrobotern auf der anderen Seite zu unterscheiden, wobei es Zusammenhänge gibt.“ Es folgten weitere Fragen und Antworten. Der Artikel zum Thema erschien am 4. Mai in der BILD und wurde am 7. Mai von der britischen Boulevardpresse aufgegriffen, etwa von The Sun und Daily News.

Abb.: Die Kombination von Puppe und Frau