Zum Inhalt springen
Patrick Beuth

Sprachassistent Google Duplex Wir müssen reden, Google

Google hat eine Software, die so tut, als wäre sie ein Mensch. Telefonisch kann sie Termine beim Friseur machen. Das Unternehmen ist ganz stolz auf sich - wieder ist die Welt ein bisschen effizienter. Man kann es auch übertreiben.
Google-Chef Sundar Pichai auf der I/O-Konferenz

Google-Chef Sundar Pichai auf der I/O-Konferenz

Foto: Jeff Chiu/ AP

Googles sprechende Software Duplex kann Telefongespräche für uns führen, auf die wir keine Lust haben. Die Demonstration war der gruselig-geniale Höhepunkt von Googles Entwicklerkonferenz I/O: Duplex rief einen Friseursalon und ein Restaurant an, um einen Termin beziehungsweise einen Tisch zu reservieren. In beiden Fällen schien der Mensch am anderen Ende der Leitung nicht zu bemerken, dass er mit einem Computerprogramm redet. Duplex klingt wie ein Mensch, intoniert, pausiert, versteht Nachfragen und streut hier und da ein "hmm" oder "äh" ein.

Kaum war der Beifall verklungen, ging die Debatte los: Darf eine künstliche Intelligenz (KI) einen Menschen derart in die Irre führen? Ist Googles Ethik-Kompass noch zu retten? Das Telefonbeispiel schien vielen allzu offensichtlich auf die Täuschung ausgelegt, nicht darauf, beiden beteiligten Menschen - also dem Auftraggeber des Anrufs und dem Angerufenen - einen besonders hilfreichen Service zu bieten.

Zudem könnte eine allgemein verfügbare KI, die sich nicht offenbart, das Misstrauen der Menschen in Technik verstärken. Weil der Enkeltrick ein automatisierbarer Betrugsversuch wird - oder schlicht, weil wir anders reden und anderes sagen würden, wenn wir wüssten, dass eine Maschine zuhört statt eines Menschen.

Google verspricht, dass Duplex sagt, was es ist

Mittlerweile hat das Unternehmen reagiert und in einem Statement für das Techportal "The Verge"  klargestellt, dass Duplex sich zu erkennen geben werde: "Wir entwickeln die Funktion mitsamt einer eingebauten Offenlegung und werden sicherstellen, dass sich das System ordentlich identifiziert." Wie Duplex das tun wird, geht daraus allerdings nicht hervor.

Fotostrecke

Google i/o 2018: Das Festival der Nerds

Foto: SPIEGEL ONLINE

Dafür stellt sich nun die Frage, was das "hmm" und "äh" dann noch bezwecken soll. Warum sollte eine KI so etwas sagen wie "Hallo, Sie sprechen mit einer Software" und dann im Gespräch - sofern es dann noch stattfindet - "äh" und "hmm" benutzen?

Weil es geht. Google wollte angeben, gerade auf seiner Entwicklerkonferenz. Das Unternehmen wollte zeigen, dass niemand auf der Welt weiter ist, eine Maschine darauf zu trainieren, ein möglichst natürliches Gespräch mit einem Mensch zu führen. Diese Kommunikationsform ist von zentraler Bedeutung für Google: Je allgegenwärtiger sprachgesteuerte Assistenten in Lautsprechern, Autos und anderen Gegenständen werden, desto mehr verliert die klassische Suchmaschine mit ihrem Texteingabefeld an Bedeutung.

Gmail-Erweiterung Smart Compose: ganze Sätze aus der Schublade

Wie viel Google in das Sprachverständnis seiner Software investiert, zeigt eine ebenfalls auf der I/O vorgestellte, aber weniger beachtete Erweiterung für den E-Mail-Dienst Gmail: Sie heißt Smart Compose  und kann E-Mails für uns vorschreiben, die wir nicht selbst ausformulieren wollen.

Smart Compose macht (zunächst nur auf Englisch) Vorschläge für Begrüßungs- und Abschiedsfloskeln, aber auch für Sätze dazwischen. Google zeigt das an einem Beispiel für eine Verabredung zum Essengehen: Tippt ein Mensch "Hab dich l" ein, bietet Smart Compose an, den Satz mit "ange nicht gesehen" weiterzuführen. Auf "Ich h" folgt der Vorschlag "offe, es geht dir gut". Auf "Lass uns" folgt "bald mal wieder treffen". Mitunter sind die Ergänzungsvorschläge auch kontextbezogen. An einem Freitag könnte zum Beispiel "Hab ein tolles Wochenende" als Schlusswort erscheinen.

Kommunikation als ein Best-of der Trainingsdaten

Ein Duplex-Anruf klingt, als sei ein Mensch am Telefon. Smart Compose stellt E-Mails zusammen, die wirken, als habe ein Mensch sie geschrieben.

Oberflächlich wirkt es deshalb so, als ob Googles Dienste sich allmählich der menschlichen Kommunikationsweise annähern. Tatsächlich aber ist es umgekehrt: Wenn wir so kommunizieren, wie Google es sich vorstellt, nähern wir uns zunehmend einer Automatensprache an. Was wir sie in unserem Namen sagen oder schreiben lassen, ist ein Best-of aus Tausenden Stunden oder Zeilen Trainingsmaterial und daher unpersönlich. Es ist auf maximale Zeitersparnis ausgelegt. Es besteht aus vorhersehbaren Standardphrasen und Satzbausteinen bar jeglicher Kreativität. Im Fall von Duplex funktioniert das Gespräch zudem nur, wenn der Angerufene in einem sprachlichen Rahmen bleibt, den die Software kennt.

Smart Compose und Duplex reduzieren den zwischenmenschlichen Austausch auf einen Job, der erledigt werden muss. Allzu viel Beifall sollte Google dafür nicht bekommen.