Adelina schreibt und spricht Baskisch

Conversational Agents sind seit einem Vierteljahrhundert ein Forschungsgegenstand von Prof. Dr. Oliver Bendel. Ihnen – genauer gesagt den Pedagogical Agents, die man heute wohl Virtual Learning Companions nennen würde – widmete er seine Doktorarbeit an der Universität St. Gallen von Ende 1999 bis Ende 2022. Seit 2009 ist er Professor an der Hochschule für Wirtschaft FHNW. Ab 2012 entstanden vor allem Chatbots und Sprachassistenten im Kontext der Maschinenethik, unter ihnen GOODBOTLIEBOTBESTBOT und SPACE THEA. 2022 wandte sich der Wirtschaftsinformatiker und Technikphilosoph dann toten und gefährdeten Sprachen zu. Unter seiner Betreuung entwickelte Karim N’diaye den Chatbot @ve für Latein und Dalil Jabou den mit Sprachausgabe erweiterten Chatbot @llegra für Vallader, ein Idiom des Rätoromanischen. Derzeit testet er die Reichweite von GPTs – „custom versions of ChatGPT“, wie OpenAI sie nennt – für gefährdete Sprachen wie Irisch (Irisch-Gälisch), Maori und Baskisch. Nach Auskunft von ChatGPT gibt es zu ihnen relativ viel Trainingsmaterial. Am 12. Mai 2024 wurde – nach Irish Girl und Maori Girl – eine erste Version von Adelina erstellt. Der Name soll an die Lehrerin Adelina Méndez de la Torre erinnern, die sich für einen bilingualen Unterricht und den Erhalt der baskischen Sprache eingesetzt hat. Der Chatbot scheint diese dem ersten Anschein nach durchaus im Griff zu haben. Man kann sich die Antworten auf Englisch oder Deutsch übersetzen lassen. Adelina ist im GPT Store verfügbar und wird in den nächsten Wochen weiter verbessert.

Abb.: Adelina schreibt und spricht Baskisch (Bild: Ideogram)

Bing – aus der Suchmaschine wird dank ChatGPT eine Antwortmaschine

Microsoft hat ChatGPT in seine Suchmaschine Bing integriert. Man bekommt auf der linken Seite des Bildschirms wie gewohnt eine Liste mit Websites angezeigt, rechts aber die Antworten des Chatbots und Content-Generators. So kann man nach einem Rezept für ein Drei-Gänge-Menü für sechs Personen fragen, die sich vegetarisch ernähren. Bing schlägt nicht nur das Drei-Gänge-Menü vor, sondern erlaubt auch gezielte Nachfragen zur Zubereitung. Wenn man sich erkundigt, wie man die Pilzcremesuppe zubereitet, gibt das System weitere Details preis. Microsoft fällt seit jeher dadurch auf, dass es die deutsche Sprache verfälscht. Im Thesaurus von MS Word wurde früher für das Wort „dunkel“ das Unwort „negerfarbig“ angegeben. Die Rechtschreibprüfung des Textverarbeitungsprogramms ignoriert wesentliche Regeln der deutschen Rechtschreibung, vor allem zu Getrennt- und Zusammenschreibung. Auf LinkedIn und Twitter herrscht eine Kunstsprache vor, in der im Wortinneren Sternchen oder Doppelpunkte vorkommen. ChatGPT gefällt bisher durch relativ korrekte Sätze. Aber auf der Website von Bing wird man wieder stutzig. Dort heißt es etwa: „Stellen Sie Fragen, wie Ihnen gefällt. Führen Sie eine komplexe Suche durch. Zur Nachverfolgung. Verfeinern Sie den Chat. Sie werden verstanden – und erstaunt.“ (Website Bing) Das erstaunt in der Tat, und man würde sich wünschen, dass Microsoft und andere Unternehmen – deutsche wie DeepL eingeschlossen – die deutsche Sprache in Zukunft besser behandeln.

Abb.: Staunen über die Sprache

Ein paar Sätze zur Sprache

„Bei Sprache handelt es sich um Systeme der Kommunikation von Menschen, Tieren und Maschinen.“ Mit diesem Satz beginnt ein neuer Beitrag von Oliver Bendel im Gabler Wirtschaftslexikon. Nach grundsätzlichen Erklärungen und einer Darstellung von Entwicklung und Geschichte werden Ansätze einer Systemtheorie entwickelt, in der existenziellen Systemen wie Sprache und Moral sowie zivilisatorischen Systemen wie Politik, Journalismus, Wissenschaft und Kunst eine spezifische Aufgabe zugesprochen wird, deren Erfüllung jeweils durch ein anderes System beeinträchtigt werden kann. Diese Überlegungen kulminieren in der Feststellung, Sinn und Zweck von Sprache sei „nicht, moralisch zu sein“. Im Weiteren wird auf Dialogsysteme eingegangen, die natürliche Sprache verwenden, und auf Technologien und Programme, die Sprache übersetzen und bearbeiten, wobei hier oft ein Bias vorhanden ist und von offiziellen Regeln abgewichen wird. Ein eigener Abschnitt gehört den wirtschaftlichen Aspekten. Am Ende wird Kritik an Strömungen innerhalb der zuständigen Disziplin geübt: „Die Linguistik, die Sprache eigentlich beobachten und untersuchen sollte, gefällt sich in ihren vermeintlich progressiven Ausläufern darin, ihren eigenen Gegenstand zu manipulieren und zu instrumentalisieren. Dem tritt allerdings die klassische Sprachwissenschaft entgegen, wobei sie alte Größe zurückgewinnt, sofern sie nicht im Nostalgischen und Konservatorischen steckenbleibt.“ Zudem werden Überlegungen u.a. aus der Perspektive von Informationsethik, Medienethik, Roboterethik und Wirtschaftsethik angestellt. Der Beitrag ist am 31. Januar 2023 erschienen und kann über wirtschaftslexikon.gabler.de/definition/sprache-124739 aufgerufen werden.

Abb.: In ein Wörterbuch vertieft

Die kleine Schwester von ChatGPT

Am 19. Januar 2023 fand die Abschlusspräsentation zum Projekt @ve statt, das im September 2022 begonnen hatte. Der Chatbot läuft auf der Website www.ave-bot.ch und auf Telegram. Er basiert wie ChatGPT auf GPT-3 von OpenAI (bei @ve handelt es sich aber nicht um GPT-3.5, sondern um GPT-3.0). Initiiert hat das Projekt Prof. Dr. Oliver Bendel, der sich verstärkt toten, ausgestorbenen und gefährdeten Sprachen widmen will. Entwickelt wurde @ve von Karim N’diaye, der an der Hochschule für Wirtschaft FHNW Wirtschaftsinformatik studiert hat. Man kann sich mit ihr auf Lateinisch unterhalten, also in einer toten Sprache, die dadurch gewissermaßen lebendig wird, und ihr Fragen zur Grammatik stellen. Getestet wurde sie von einer einschlägigen Expertin. Ein Nutzen besteht laut Karim N’diaye darin, dass man rund um die Uhr auf Latein kommunizieren kann und dabei überlegen muss, was und wie man schreibt. Eine Gefahr sei, dass immer wieder Fehler in den Antworten enthalten sind. So ist zuweilen die Wortreihenfolge nicht korrekt. Zudem kann es sein, dass der Sinn verdreht wird. Dies kann bei einem menschlichen Lehrer freilich auch passieren, und der Lernende sollte in jedem Falle wachsam sein und nach Fehlern suchen. Ohne Zweifel ist @ve ein Tool, das mit Gewinn in den Lateinunterricht integriert werden kann. Dort können die Schüler berichten, was sie mit ihr zu Hause erlebt haben, und sie können mit ihr vor Ort alleine oder in der Gruppe, vom Lehrer begleitet, einen Schwatz halten. Ein Nachfolgeprojekt zu einer gefährdeten Sprache ist bereits ausgeschrieben.

Abb.: Die Website mit dem Fenster von @ve

Conversational Agents für tote, ausgestorbene und gefährdete Sprachen

Chatbots und Sprachassistenten – sogenannte Conversational Agents – entstanden an der Hochschule für Wirtschaft FHNW von 2012 bis 2022 vor allem im Kontext der Maschinenethik und Sozialen Robotik. Prof. Dr. Oliver Bendel möchte sich nun verstärkt um tote, ausgestorbene und gefährdete Sprachen kümmern. @ve ist ein erster Versuch in dieser Richtung. Gewonnen werden konnte dafür im September 2022 der Entwickler Karim N’diaye. Er stellte am 17. November 2022 an der Hochschule die Zwischenergebnisse vor. Der Chatbot basiert auf GPT-3, einem Sprachmodell, das Deep Learning einsetzt, um natürlichsprachliche Fähigkeiten zu erlangen. Das neuronale Netzwerk weist etwa 175 Milliarden Parameter auf, was einen Rekord darstellt. Kombiniert mit einer Wissensdatenbank, welche Informationen über die lateinische Sprache enthält, kann @ve präzise Antworten auf Benutzeranfragen generieren. Mit ihr kann man also auf Lateinisch plaudern und etwas darüber erfahren. Weitere Projekte mit Chatbots und Sprachassistenten ab 2023 sollen sich gefährdeten und aussterbenden Sprachen widmen. Latein wird an vielen Schulen und Hochschulen gelehrt und immer noch für das eine oder andere Studium – etwa der Philosophie – vorausgesetzt respektive gewünscht. Mit „Romulus“ hat Sky Italia eine Serie in dieser toten Sprache produziert und sie damit ein Stück weit lebendig gemacht. In Deutschland ist sie auf Magenta TV mit Untertiteln zu sehen. Informationen zu @ve werden Ende Dezember 2022 über www.ave-bot.ch bereitgestellt.

Abb.: Auch Sardisch ist eine gefährdete Sprache

Der Umgang von Microsoft mit der deutschen Sprache

Im Frühjahr 2008 stellte Oliver Bendel in seinem Artikel „Im Rachen des Thesaurus“, erschienen in Telepolis, „Beobachtungen zum Synonymwörterbuch von Microsoft“ an, also zu einem Softwareservice von MS Word. Als Synonym zu „dunkel“ wurde damals von dem US-amerikanischen Unternehmen „negerfarbig“ vorgeschlagen. Der Autor kam insgesamt zum Ergebnis: „Manche Wörter … veraltet, manche grenzwertig, manche falsch, manche Verbindungen nicht nachvollziehbar.“ Später traten Überlegungen zur Rechtschreibprüfung von MS Word hinzu. Diese schien mit der Zeit immer schlechter zu werden, womöglich weil man sich von einem seriösen Wörterbuch verabschiedete und sich auf künstliche Intelligenz verließ. Zu allen Zeiten fiel auf, dass wesentliche Prinzipien der deutschen Sprache nicht verstanden werden. So schlägt die Rechtschreibprüfung bei einem aktuellen Test vor, statt „Sexpuppen“ entweder „Sex puppen“ oder „Sex Puppen“ zu verwenden, statt „Fantasyfiguren“ „Fantasy Figuren“. Jedes Kind weiß, dass man deutsche Komposita zusammenschreibt bzw. durchkoppelt, sogar ein Kind, das in den USA oder in Japan vom „Donaudampfschifffahrtsgesellschaftskapitän“ gehört hat – der Techriese, eine der führenden KI-Firmen, weiß es nicht. Sein Ableger LinkedIn tut sich genauso schwer mit der deutschen Sprache. So liest man etwa: „Andere Mitglieder reagieren auf einen Beitrag eines:einer Kolleg:in“. Abgesehen davon, dass es sich hier um eine Fantasiesprache handelt, wird sie auch noch so benutzt, dass die Männer verschwinden. Aus dem „Kollegen“ wird der oder das „Kolleg“, was immer das bedeuten soll. Auf eine Beschwerde bei LinkedIn kommt eine Nachricht, die so beginnt: „Ich hoffe, diese Mail findet Sie in Ihrer gut Gesundheit. Mein Name ist Trupti und ich würde Ihnen heute gerne helfen.“ Aber Trupti kann leider nicht helfen, reiht nur Worthülse an Worthülse („Ich habe Ihren Vorschlag zur Überprüfung an unser Produktteam weitergeleitet. Wir suchen stets nach Möglichkeiten, die LinkedIn-Erfahrung zu verbessern und berücksichtigen dabei das Feedback unserer Nutzer …“) und setzt so die unselige Tradition von Microsoft im Umgang mit der deutschen Sprache fort.

Abb.: Microsoft in Köln