Künstliche Intelligenz von Google„Manchmal merkt Gemini, dass eine Person aus Bayern kommt“

Lesezeit 5 Minuten
Ein Google-Schriftzug ist auf einer Wiese von einem Gebäudekomplext in Hanau in der Nähe von Frankfurt aufgebaut.

Google Datenzentrum in Hanau in der Nähe von Frankfurt.

Die wichtigste Suchmaschine der Welt bringt ihre Künstliche Intelligenz weltweit ins Netz. Gemini kann 46 Sprachen – und soll bitte nicht vulgär antworten.

Auch eine Künstliche Intelligenz (KI) braucht Sprachtraining. Als Computerlinguistin ist es Sabine Lehmanns Job bei Google in Zürich, dem Chatbot Gemini Sprachen beizubringen. Im Interview erklärt sie, wie das funktioniert – und warum Dialekte ihr Team vor Herausforderungen stellen.

Frau Lehmann, Sie sind Computerlinguistin bei Google und bringen dem Chatbot Gemini Deutsch bei. Sind Sie also quasi die Deutschlehrerin – und Gemini Ihr Schüler?

(lacht) Nicht ganz. Ja, mein Team und ich sorgen dafür, dass Gemini neben Englisch noch 45 weitere Sprachen spricht. Man kann sich das aber nicht wie einen klassischen Sprachunterricht mit Menschen vorstellen. Gemini funktioniert auf der Basis von Daten, die aus öffentlichen Quellen im Internet stammen. Und unsere Aufgabe ist es, ihn mit sprachlich guten und faktisch korrekten Daten weiter zu trainieren, sodass Gemini immer bessere Antworten gibt.

Ich würde eher sagen, dass Gemini mehrsprachlich „aufgewachsen“ ist
Linguistin Sabine Lehmann über die Künstliche Intelligenz von Google

Wie kann man sich diesen Prozess vorstellen?

Es ist ein bisschen so wie mit einem Kind. Wenn ein Kind auf eine Frage eine unangebrachte Antwort gibt, sagen Eltern zum Beispiel „sei doch bitte höflicher“ – und erklären, wie es zukünftig antworten könnte. Wenn Gemini auf einen Prompt antwortet, bewerten wir ebenfalls die Qualität in faktischer und sprachlicher Hinsicht. Mein Team und ich trainieren Gemini mit öffentlich verfügbaren Daten und zeigen ihm damit, wie eine gute Antwort in der jeweiligen Sprache aussieht. Wir haben dafür eine Reihe an Kriterien.

Woran bemessen Sie die Qualität der Antworten?

Alle Antworten sollten natürlich allen voran hilfreich und korrekt sein. Wichtig ist auch, dass die Antworten klar verständlich und die Sätze nicht zu kurz oder zu lang sind. In Hinblick auf die sprachliche Qualität sollten sie nicht übersetzt klingen, sondern natürlich. Zudem sollten sie angemessen klingen, also nicht umgangssprachlich oder vulgär.

Ist es denn wirklich schlimm, wenn Gemini auch mal lockerer und umgangssprachlicher antwortet?

Es kommt immer auf die Bedürfnisse der Userinnen und User an. Jemand, der eher locker und salopp spricht – und dementsprechend auch so seine Prompts schreibt –, möchte womöglich auch eher eine lockere Antwort. Aber wer sich formelle Antworten wünscht, wird sich an Umgangssprache wahrscheinlich mehr stören. Teilweise erkennt Gemini auch schon, in welchem Stil Userinnen und User ihre Prompts schreiben – und antwortet im entsprechenden Stil. Auch das wollen wir weiterhin verbessern. Schon jetzt haben Nutzerinnen und Nutzer außerdem über einen Regler die Möglichkeit, ihre Antwort anzupassen, sodass sie zum Beispiel informeller, professioneller, länger oder kürzer wird.

Beherrscht Gemini alle seine 46 Sprachen schon perfekt – oder braucht der Chatbot noch Nachhilfe?

Wir sind bislang sehr zufrieden, gerade mit den häufig gesprochenen Sprachen wie Deutsch. Gemini lernt die Sprache ohnehin immer parallel, wenn es mit neuen Daten gefüttert wird. Woran unser Team aber stets arbeitet, sind unter anderem sprachliche Nuancen und Dialekte. Wir wissen, dass es zum Beispiel bei Arabisch sein kann, dass Gemini nicht – wie von ägyptischen Nutzerinnen und Nutzern meist gewünscht – im ägyptischen Dialekt antwortet, sondern in einem anderen. Das wollen wir verbessern.

Warum ist Ihnen das wichtig?

Denken Sie an Portugiesisch. Das brasilianische Portugiesisch unterscheidet sich von dem, das man in Portugal spricht: Es hat teilweise andere Wörter und klingt anders. Wenn ein Mensch in Brasilien aber keine Antwort in seinem Dialekt bekommt, fühlt sie sich für ihn mitunter nicht authentisch an. Wenn ein Chatbot im jeweiligen Dialekt antwortet, geht er dagegen auch sprachlich auf die Bedürfnisse der Userin oder des Users ein.

Ist es schwierig, einem Chatbot einen Dialekt beizubringen?

Interessanterweise kann Gemini schon viele Dialekte, zum Beispiel teilweise auch Bairisch. Man kann den Chatbot zum Beispiel im Prompt dazu auffordern, auf Bairisch zu antworten. Manchmal merkt er auch schon anhand der Schreibweise, dass eine Person aus Bayern kommt – und antwortet dementsprechend in dem Dialekt. Das ist erstaunlich, weil wir ihm nie explizit Bairisch beigebracht haben. Das Modell weiß einfach schon viel über verschiedene Dialekte, weil es diese Daten im Netz gibt. Trotzdem ist es gerade bei Dialekten eine Herausforderung, den Chatbot zu trainieren.

Warum?

Weil es sich in Balance halten muss. Würden wir zu sehr auf einen Dialekt trainieren, könnte es vorkommen, dass Gemini zu oft in diesem Dialekt antwortet. Das wäre dann auch unpassend. Die Frage ist also immer: Mit wie vielen Daten, die in bestimmten Dialekten verfasst sind, sollten wir Gemini trainieren?

Gemini hieß früher Bard – und Bard war während der Testphase zunächst auf Englisch in den USA und im Vereinigten Königreich verfügbar. Ist Gemini also quasi ein Native Speaker und beherrscht Englisch am besten?

Ich würde eher sagen, dass Gemini mehrsprachlich „aufgewachsen“ ist. Klar, der Chatbot konnte Englisch von Anfang an sehr gut, zumal Gemini hier auf eine große Datenbasis zugreifen kann. Aber das heißt nicht, dass er andere Sprachen zwingend schlechter beherrscht. Englisch ist zudem nicht gleich Englisch: In den USA wird anders gesprochen als in Australien. Wir arbeiten also daran – so wie mit jeder anderen Sprache auch –, dass Gemini auch Englisch immer besser beherrscht.

Lernt Gemini denn schnell?

Ja, ich würde auch gern so schnell lernen (lacht). Wir haben schließlich auch in unserem Team Expertinnen und Experten für jede Sprache, die Gemini spricht. Dennoch muss Gemini genauso wie ein Mensch kontinuierlich eine Sprache trainieren, um immer besser zu werden. Das ist ein permanenter Optimierungsprozess.

KStA abonnieren