On February 19, 2024, the article „@llegra: a chatbot for Vallader“ by Oliver Bendel and Dalil Jabou was published in the International Journal of Information Technology. From the abstract: „Extinct and endangered languages have been preserved primarily through audio conservation and the collection and digitization of scripts and have been promoted through targeted language acquisition efforts. Another possibility would be to build conversational agents like chatbots or voice assistants that can master these languages. This would provide an artificial, active conversational partner which has knowledge of the vocabulary and grammar and allows one to learn with it in a different way. The chatbot, @llegra, with which one can communicate in the Rhaeto-Romanic idiom Vallader was developed in 2023 based on GPT-4. It can process and output text and has voice output. It was additionally equipped with a manually created knowledge base. After laying the conceptual groundwork, this paper presents the preparation and implementation of the project. In addition, it summarizes the tests that native speakers conducted with the chatbot. A critical discussion elaborates advantages and disadvantages. @llegra could be a new tool for teaching and learning Vallader in a memorable and entertaining way through dialog. It not only masters the idiom, but also has extensive knowledge about the Lower Engadine, that is, the area where Vallader is spoken. In conclusion, it is argued that conversational agents are an innovative approach to promoting and preserving languages.“ Oliver Bendel has been increasingly focusing on dead, extinct and endangered languages for some time. He believes that conversational agents can help to strengthen and save them.
Der Technikphilosoph und Wirtschaftsinformatiker Prof. Dr. Oliver Bendel widmet sich seit einiger Zeit verstärkt toten, ausgestorbenen und gefährdeten Sprachen. Er ist der Meinung, dass Conversational Agents zu ihrer Stärkung und Rettung beitragen können. Nach @ve (2022), einem auf GPT-3 basierenden Chatbot für Latein, startete im März 2023 ein weiteres Projekt. Entwickelt wurde bis August 2023 der Chatbot @llegra von Dalil Jabou für das rätoromanische Idiom Vallader, das im Unterengadin zwischen Martina im Nordosten und Zernez im Südwesten sowie im Val Müstair auftritt und gefährdet ist. Der Chatbot beruht auf dem Sprachmodell GPT-4. Er hat Texteingabe und -ausgabe sowie Sprachausgabe. Der Avatar ist ein Steinbockmädchen. Man kann in Deutsch oder Rätoromanisch mit @llegra kommunizieren – sie versucht sich immer auf Vallader. Manchmal rutscht sie in Sursilvan oder Rumantsch Grischun. Das Paper „@llegra: A Chatbot for Vallader“ von Oliver Bendel und Dalil Jabou wurde nun vom International Journal of Information Technology angenommen. Es wird in einigen Wochen erscheinen. Das nächste Idiom des Rätoromanischen soll noch in diesem Jahr in Angriff genommen werden.
Abb.: Ein Junge im Unterengadin plaudert mit @llegra
Dalil Jabou wurde für seine Bachelorarbeit „@llegra – Chatbot für Vallader“ an der Hochschule für Wirtschaft FHNW ausgezeichnet. In dem Dokument, das von Prof. Dr. Regula Altmann-Jöhl (Direktorin) und Prof. Dr. Charlotte Hofstetter (Mitglied der Hochschulleitung) am 28. September 2023 unterschrieben wurde, heißt es: „Wir gratulieren Ihnen zum erfolgreichen Abschluss in Wirtschaftsinformatik (Bachelor of Science FHNW). Es freut uns Ihnen mitzuteilen, dass Sie unter allen Kandidatinnen und Kandidaten Ihres Studienjahrgangs die beste Bachelor-Arbeit erzielt haben.“ Das Projekt, dessen zentraler Bestandteil diese Arbeit war, fand von Februar bis August 2023 statt. Initiator und Betreuer war Prof. Dr. Oliver Bendel. Ziel war es, einen Chatbot für ein Idiom des Rätoromanischen zu entwickeln. Die Wahl fiel auf Vallader, das im Unterengadin gesprochen wird. Der Chatbot hat Texteingabe und -ausgabe, zudem Sprachausgabe. Diese wurde mit einer Text-to-Speech-Engine der Zürcher Firma SlowSoft ermöglicht. Der Avatar ist ein Steinbock. In einem Video wird gezeigt, wie der Chatbot funktioniert. Ebenfalls für die beste Bachelorarbeit wurde Andrin Allemann geehrt. Er hatte – unter der Betreuung von Oliver Bendel – den sozialen Roboter Alpha Mini in eine Lernanwendung mit einem MS Surface integriert.
Zu @llegra, einem Chatbot für Vallader, liegt seit 10. September 2023 ein Video vor. Vorgeführt wird ein kurzes Gespräch mit Texteingabe und -ausgabe sowie Sprachausgabe. Conversational Agents sind seit einem Vierteljahrhundert ein Forschungsgegenstand von Prof. Dr. Oliver Bendel. Ihnen widmete er seine Doktorarbeit an der Universität St. Gallen. An der Hochschule für Wirtschaft FHNW entstanden sie von 2012 bis 2022 vor allem im Kontext der Maschinenethik und Sozialen Robotik. Der Technikphilosoph und Wirtschaftsinformatiker widmet sich seit einiger Zeit verstärkt toten, ausgestorbenen und gefährdeten Sprachen. Nach @ve (2022), einem auf GPT-3 basierenden Chatbot für Latein, startete im März 2023 ein weiteres Projekt. Entwickelt wurde bis August 2023 der Chatbot @llegra von Dalil Jabou für das rätoromanische Idiom Vallader, das im Unterengadin zwischen Martina im Nordosten und Zernez im Südwesten sowie im Val Müstair auftritt und gefährdet ist. Der Chatbot beruht auf dem Sprachmodell GPT-4. Das hat den Vorteil, dass er von Haus aus mächtig ist, und den Nachteil, dass man ihn noch nicht mit eigenem Material trainieren kann – was sich erst Ende des Jahres ändert. Entsprechend rutscht @llegra immer wieder in Sursilvan und Rumantsch Grischun, wenn sie auf Vallader nicht weiterweiß. Das kann freilich auch Menschen passieren, die gerade von Flims nach Scuol gezogen sind und regelmäßig RTR gesehen oder gehört haben. Das Video kann über YouTube aufgerufen werden.
Abb.: Eine junge Frau benutzt einen Chatbot in den Alpen
Vom 1. März bis 11. August 2023 erstellte Dali Jabou im Rahmen seiner Bachelorarbeit den Chatbot @llegra, mit dem man im rätoromanischen Idiom Vallader kommunizieren kann. Es handelt sich um ein von Prof. Dr. Oliver Bendel initiiertes und finanziertes Low-Budget-Projekt, für das bisher ca. 300 CHF ausgegeben wurden. Die Ausgangsfrage ist, ob sich Sprachmodelle wie GPT für den Bau von Chatbots eignen, die tote, gefährdete oder ausgestorbene Sprachen beherrschen, und ob sie für die Spracherhaltung taugen (etwa im Rahmen des Unterrichts). Mit @llegra entstand ein Chatbot mit Sprachausgabe, der die Stärken und Schwächen von GPT-4 widerspiegelt. Er verfügt über Weltwissen und gibt mehrheitlich korrekt Auskunft, auch zu Einrichtungen im Unterengadin. Manchmal halluziniert er und erfindet Personen oder Werke – ein bekanntes Problem von Sprachmodellen, an dem die Entwickler bei OpenAI, Microsoft, Google und Co. arbeiten. Ein weiteres Problem ist, dass er manchmal vom Idiom abweicht und sich in Sursilvan und Rumantsch Grischun verirrt. Er wird sich weiter verbessern lassen, sobald man GPT-4 (wie im Falle von GPT-3) direkt mit Sprachmaterial trainieren kann – was noch nicht der Fall ist (eine Wissensdatenbank, angereichert mit Vallader-Kinderbüchern, zur Verfügung gestellt von der Lia Rumantscha, war aber hilfreich). Die Text-to-Speech-Engine für Vallader, die von SlowSoft kostenlos zur Verfügung gestellt wurde, erfüllt ihren Zweck. Man darf sie nicht mit einer professionellen Lösung verwechseln, wie sie heute mit Hilfe von Machine Learning möglich wäre. Der Chatbot stand auf allegra-bot.ch zur Verfügung, damit eingeladene Tester unkompliziert darauf zugreifen und auch Versuche im Feld (etwa direkt im Unterengadin) stattfinden konnten. Nachdem mehrere Medien über den Chatbot berichtet und den Link verbreitet hatten, nahmen die Zugriffe stark zu. Um die Kosten nicht zu stark anwachsen zu lassen und deutlich zu machen, dass es sich um ein wissenschaftliches Projekt und eine unfertige Vorstufe – einen Prototyp – handelt, nicht um einen öffentlichen Dienst und nicht um ein fertiges Produkt, wurde der Chatbot mit einer entsprechenden Information auf der Seite am 11. August vorerst stillgelegt. Er wird intern weiter getestet und verbessert, bis er Ende des Jahres (sofern die Annahme erfolgt) auf einer internationalen Konferenz vorgestellt wird. Im Rahmen der Begutachtung findet eine Freischaltung von September bis Dezember statt. Oliver Bendel wünscht sich, dass weitere Entwickler den Ansatz aufgreifen und irgendwann eine @llegra entsteht, die im Unterricht eingesetzt werden kann. Dafür müssten Unternehmen die Sache in die Hand nehmen, oder es müsste ein finanziertes Forschungs- und Entwicklungsprojekt aufgelegt werden. In letzterer Richtung unternimmt die FH Graubünden, mit der man in Kontakt ist, seit einiger Zeit Anstrengungen. Bei der Abschlusspräsentation der Bachelorarbeit am 11. August waren neben einer Vertreterin dieser Hochschule auch zwei Vertreter der Lia Rumantscha zugegen, die sich beeindruckt zeigten und wohlwollend äußerten. @llegra hat eine Zukunft – wenn man dies im rätoromanischen Sprachraum will.
Abb.: So stellen sich Bildgeneratoren Chatbots vor
Ausgestorbene und gefährdete Sprachen werden in erster Linie durch Audiokonservierung und die Sammlung und Digitalisierung von Schriften bewahrt und durch gezielte Maßnahmen zum Spracherwerb gefördert. Eine weitere Möglichkeit wäre die Entwicklung von Conversational Agents, die diese Sprachen beherrschen. Damit hätte man einen interaktiven Gesprächspartner, mit dem man auf eine andere Art und Weise lernt. Der Chatbot @llegra, mit dem man im rätoromanischen Idiom Vallader kommunizieren kann, wurde im Jahre 2023 auf Basis von GPT-4 entwickelt. Er kann Text verarbeiten und ausgeben und verfügt über eine Sprachausgabe. Zusätzlich wurde er mit einer manuell erstellten Wissensbasis ausgestattet. Nach Inside IT hat nun der Tages-Anzeiger, die wichtigste Schweizer Zeitung neben der NZZ, über das Projekt berichtet, das von Prof. Dr. Oliver Bendel initiiert wurde. Der Informations- und Maschinenethiker ist auch Sponsor des Low-Budget-Projekts. Implementiert hat den Prototyp sein Student Dalil Jabou, der zahlreiche technische Schwierigkeiten gemeistert hat. Es werden bis 11. August 2023 noch laufend Verbesserungen durchgeführt. Der Artikel kann hier aufgerufen werden.
„Die Sprachdominanz in der Schweiz ist deutlich: Über 60% der Bevölkerung spricht hauptsächlich Deutsch, Rätoromanisch hingegen geben gerade mal 0,5% als Hauptsprache an. Rumantsch Grischun hat in der Schweiz aber den Status einer Landessprache. Mit der 1982 geschaffenen Amtssprache kann man also mit den Behörden kommunizieren. Die knapp 41’000 rätoromanisch sprechenden Einwohnerinnen und Einwohner der Schweiz pflegen aber lokale Idiome mit eigener Grammatik und Wörterbüchern. Tief im Osten im Unterengadin etwa wird von rund 7000 Personen Vallader gesprochen – von Dorf zu Dorf wiederum mit unterschiedlichem Dialekt. Das Idiom sei gefährdet, sagt Oliver Bendel. Der Professor an der Fachhochschule Nordwestschweiz (FHNW) hat einen Chatbot publiziert, der helfen soll, die Sprachgemeinschaft zu unterstützen und Vallader zu bewahren.“ Mit diesen Worten beginnt ein Artikel von Thomas Schwendener in Inside IT, der am 21. Juli 2023 erschienen ist. Dass die Wahl auf Vallader fiel, hing mit mehreren Entscheidungen und Zufällen zusammen. Vallader ist zunächst einmal kein ganz kleines Idiom. Zudem stand eine Text-to-Speech-Engine der Firma Slowsoft zur Verfügung. Denn das Ziel war, einen erweiterten Chatbot mit Sprachausgabe – neben Texteingabe und -ausgabe – zu bauen. Nur mit einem solchen können Kinder und Jugendliche, die das Zielpublikum bilden, die Sprache erlernen. Die von Dalil Jabou implementierte, auf GPT-4 basierende @llegra dürfte die erste KI ihrer Art sein. Weitere Projekte dieser Art sollen folgen, mit Fokus auf gefährdeten und ausgestorbenen Sprachen.
Seit März 2023 wird im Auftrag von Prof. Dr. Oliver Bendel der Chatbot @llegra für das rätoromanische Idiom Vallader entwickelt, das im Unterengadin zwischen Martina im Nordosten und Zernez im Südwesten sowie im Val Müstair auftritt und gefährdet ist. Der Entwickler Dalil Jabou hat auf das Sprachmodell GPT-4 gesetzt und alle wesentlichen technischen Probleme gelöst. Der Benutzer kann Text in Englisch, Deutsch oder Rätoromanisch eintippen und bekommt Text in Vallader ausgegeben. Zudem spricht @llegra das Idiom mit Hilfe eines Text-to-Speech-Systems der Firma SlowSoft aus Zürich. Ein kleiner Test mit einem Experten fand bereits statt und führte zu einer ersten Verbesserung. Oliver Bendel war am 9. Juli mit @llegra im Unterengadin unterwegs und suchte nach einer Testperson mit Vallader als Muttersprache. In Tarasp Fontana bei Scuol sprach er mehrere ältere Frauen an. Eine verwies auf eine Dame von vielleicht 78 Jahren, die sich in der Nähe befand und gerade vom Nordic Walking kam. Die Vallader-Sprecherin hörte sich die Antwort des Chatbots auf eine Frage zu Tarasp an und begann ungefragt, das Gesprochene ins Deutsche zu übersetzen. Dann wurde @llegra gefragt, ob sie Scuol kennt. Sie gab wiederum in Vallader eine längere Auskunft. Die ältere Dame bestätigte, dass die Aussprache gut und der Inhalt verständlich ist. Sie begann zu strahlen und fragte, ob es sich um künstliche Intelligenz handle. Oliver Bendel bestätigte dies, strahlte ebenfalls, fuhr weiter und ließ sich von @llegra in Scuol noch Informationen zum dortigen Museum d’Engiadina Bassa geben. Das Projekt wird im August 2023 abgeschlossen. Die Ergebnisse werden danach veröffentlicht.
Abb.: In einem Café beim Museum in Scuol mit @llegra
Conversational Agents sind seit einem Vierteljahrhundert ein Forschungsgegenstand von Prof. Dr. Oliver Bendel. Ihnen widmete er seine Doktorarbeit an der Universität St. Gallen. An der Hochschule für Wirtschaft FHNW entstanden sie von 2012 bis 2022 vor allem im Kontext der Maschinenethik und Sozialen Robotik. Der Technikphilosoph widmet sich nun verstärkt toten, ausgestorbenen und gefährdeten Sprachen. Nach @ve (2022), einem auf GPT-3 basierenden Chatbot für Latein, startete im März 2023 ein weiteres Projekt. Entwickelt wird der Chatbot @llegra von Dalil Jabou für das rätoromanische Idiom Vallader, das im Unterengadin zwischen Martina im Nordosten und Zernez im Südwesten sowie im Val Müstair auftritt und gefährdet ist. Der Benutzer kann Text eintippen und bekommt Text ausgegeben. Zudem spricht @llegra mit Hilfe eines Text-to-Speech-Systems der Firma SlowSoft, die das Projekt unterstützt. Das Sprachmodell GPT-3 brachte eher unbefriedigende Ergebnisse. Der Durchbruch kam dann mit der Verwendung von GPT-4. Die Wissensbasis wurde mit Hilfe von vier Kinderbüchern auf Vallader ergänzt. Das Projekt wird im August 2023 abgeschlossen. Die Ergebnisse werden danach veröffentlicht.
Chatbots und Sprachassistenten – sogenannte Conversational Agents – entstanden an der Hochschule für Wirtschaft FHNW von 2012 bis 2022 vor allem im Kontext der Maschinenethik und Sozialen Robotik. Prof. Dr. Oliver Bendel widmet sich nun verstärkt toten, ausgestorbenen und gefährdeten Sprachen. @ve für Latein war 2022 ein erster Versuch in dieser Richtung. Der Chatbot basiert auf dem Sprachmodell GPT-3. Die tote Sprache Latein wurde durch @ve ein Stück weit wieder lebendig. Im März 2023 startete auf Initiative des Technikphilosophen ein weiteres Projekt, in dem der Chatbot @llegra entwickelt wird. Dieser soll das Rätoromanische beherrschen, genauer gesagt das Idiom Vallader, das im Unterengadin zwischen Martina im Nordosten und Zernez im Südwesten sowie im Val Müstair gesprochen wird und gefährdet ist. Der Benutzer kann Text eintippen und bekommt Text ausgegeben. Zudem spricht @llegra mit Hilfe eines Text-to-Speech-Systems der Firma SlowSoft, die das Projekt unterstützt. Die Basis ist wieder, wie bei @ve, das Sprachmodell GPT-3. Für die Umsetzung konnte Dalil Jabou gewonnen werden. Für technische Aspekte steht zusätzlich Prof. Dr. Bradley Richards zur Verfügung. Das Projekt dauert bis August 2023.
Abb.: In Zernez wird das Idiom Vallader gesprochen