Mit Training gibt’s bessere Antworten

Ganz schön praktisch, so eine persönliche Assistentin: Sie schaut, wie das Wetter wird und empfiehlt die passende Kleidung. Sie bucht den Zug zum Flug, reserviert einen Tisch im Restaurant und zeigt den Weg dorthin. Sie recherchiert im Web und weiß auf viele Fragen eine Antwort. Als Faustregel gilt: Je größer ihr Datenschatz, desto besser kann sie antworten.

Deshalb ist Training wichtig. Je mehr Anfragen die Assistentin erhält, desto besser wird sie. Ihren Datenschatz hortet sie dabei in der Cloud - und das funktioniert bei allen digitalen Helferlein ähnlich: Der Nutzer spricht seine Anfrage in das Mikro seines Geräts, diese wird in die Cloud übertragen und in Text umgewandelt. Chatbots entziffern daraus Schlüsselworte wie „Wetter“ und durchforsten den eigenen Datenbestand nach der passenden Antwort, die wiederum in Sprache umgewandelt und dem Fragesteller mitgeteilt wird. Voraussetzung für eine funktionierende Wegbeschreibung via Smartphone ist es zudem, den Ortungsdienst zu aktivieren und den Zugriff darauf zu erlauben.

Digitale Sprachassistenten in Kürze

Die digitale Sprachassistentinnen Siri (Apple bietet Siri auch mit männlicher Stimme an), Cortana, Alexa oder Google Assistant funktionieren nach einem ähnlichen Prinzip: Der Nutzer gibt seine Anfrage in das Mikro seines Geräts ein, sie wird blitzschnell in die Cloud des Anbieters übertragen und in Text umgewandelt. Chatbots entziffern daraus Schlüsselworte zur gestellten Anfrage wie „Wetter“, durchforsten den eigenen Datenbestand nach der passenden Antwort, die wieder in Sprache umgewandelt und dem Fragesteller gesagt wird.

Sprache macht die Technik menschlich

Was aber begeistert uns an der Sprachsteuern genau? Vielleicht liegt es daran, dass die Benutzeroberflächen von Notebooks und Smartphones immer mehr dem ähneln, wie Menschen miteinander und mit ihrer Umwelt interagieren. In den Anfangsjahren war die Bedienung von Computern so komplex, das nur ausgebildete Fachkräfte mit ihnen umgehen konnten. Mit Display und Tastatur wurde das schon ein einfacher, sofern man sich mit den Kommandos vertraut machte. Bei der grafischen Benutzeroberfläche brauchte man zwar etwas Eingewöhnung, aber viele Vorgänge wurden bildhaft erklärt und somit einfacher. Mit Touchscreens reagiert der Computer auf bereits bekannte Gesten wie Wischen und Tippen. Die Sprachsteuerung ist nun sicherlich die bislang effizienste Form der Bedienung. Die Idealvorstellung: Der digitale Assistent versteht uns genau so gut wie ein Mensch oder sogar besser. Zugleich weiß der elektronische Helfer alles, was das Internet weiß. Und er kennt uns so gut, dass er sich fehlende Informationen selbst erschließen kann. Am Ende soll er uns Antworten liefern, bevor wir überhaupt gefragt haben.

Siri war der Anfang

Bereits 2011 machte Apples digitale Sprachassistentin Siri den Anfang exklusiv auf dem iPhone 4s, die es inzwischen auch in einer männlicher Version gibt. Einen gewissen Witz besaß Siri damals schon. Auf die Frage: „Was machst du gerade?“ antwortete sie: „Ich denke gerade nach.“ Schimpfte der Nutzer über eine unzureichende Antwort, erwiderte Siri gelassen: „Kein Grund, ausfällig zu werden“.

Bildergalerie: Die wichtigsten Sprachassistenten im Überblick

Schnittstelle zwischen Mensch und Internet

Schon jetzt können sich nach einer repräsentative Befragung im Auftrag des Digitalverband Bitkom vier von zehn (39 Prozent) Bundesbürgern ab 14 Jahren vorstellen, solche stationären Sprachassistenten zu nutzen. Davon wollen zwölf Prozent das auf jeden Fall tun. „Die Assistenten stellen eine neue Schnittstelle zwischen Mensch und Internet dar. Mit den smarten Lautsprechern können kompatible, WLAN-fähige Geräte gesteuert und Web-Anwendung bedient werden“, so Lutter.

Das funktioniert auch im Auto: BMW präsentierte beispielsweise auf der diesjährigen CES-Technikmesse in Las Vegas einen Prototyp, der Cortana an Bord hat, und Amazon stellte Alexa in Ford-Modellen vor.

Alexa Die Smarthome-Box: Amazons Sprachassistentin Alexa steuert auch vernetzte Kühlschränke (wie den LG InstaView Door-in-Door) per Sprache. (© 2017 Getty Images) - 2017 Getty Images

Sprachassistenten fürs Smarthome

„Die Technologie hat das Potenzial, die Haushalte zu erobern und den Alltag in den eigenen vier Wänden zu vereinfachen,“ meint Timm Lutter, Bitkom-Experte für Consumer Electronics und Digital Media. Dank intelligenter Lautsprecher wie Amazon Echo und Google Home lassen sich künftig auch andere Geräte im Haushalt wie Lampe, Musikanlage, Fernseher oder Heizung per Sprachbefehl steuern, wenn sie mit dem WLAN verbunden sind.

Digitale Sprachassistenten Das Smarthome per Sprache steuern: Das wäre laut einer repräsentativen Umfrage des Branchenverbandes Bitkom mit Abstand das wichtigste Einsatzgebiet für digitale Sprachassistenten. (© 2017 Bikom)

Die Stimme macht die digitale Persönlichkeit

Wie finden die Nutzer ihre digitalen Assistentinnen? Die Stimme spielt eine wichtige Rolle in der persönlichen Kommunikation.

Nach einer Befragung unter rund 1.000 Nutzern von Statista in diesem Jahr sind 93 Prozent zufrieden mit den Stimme ihrer digitalen Assistentinnen (noch ohne Bixby). Siri und Cortana stuften sie dabei als am klar verständlichsten ein, Alexa als am angenehmsten. Das deutsche Wirtschaftsmagazin BILANZ ging noch einen Schritt weiter und bat den Bremer Profiler Axel Petermann und die auf Sprachanlayse spezialisierten Aachener Firma Precire um Persönlichkeitsprofile der digitalen Sprachassistentinnen aufgrund ihrer Stimme. Die Ergebnisse:

  • Siri, 2011 als erste digitale Assistentin im iPhone 4s gestartet, wird als intelligent, schlank und sexy, mittelgroß, dunkelhaarig und mit Brille beschrieben. Sie verfügt über Charme, Ausstrahlung und Humor, gilt als aufmerksame Zuhörerin und scheint sogar mit dem Nutzer zu flirten.
  • Cortana Sie wird als nicht so weit entwickelt eingeschätzt wie Siri und Amazons Alexa, aber arrogant wie Madonna, allerdings ohne ihre schillerndes Wesen. Sie soll sachliche Antworten geben, wird aber als nicht sehr klug, klein und unscheinbar, ja sogar bieder beurteilt.
  • Alexa, seit 2015 die Stimme von Amazons Lautsprechermikrophons Echo und seit Februar der deutschen Sprache mächtig, wird als braunhaarig, erotisch, vollschlank eingestuft, als Freundin des Anwenders aber weniger charmant und humorvoll als Siri.
  • Google Assistant, seit 2016 die Nachfolgerin von Google Now, kann besonders gut Fragen beantworten. Sie gilt als clever, schlank, mittelgroß, rothaarig, bebrillt und erledigt Aufgaben gewissenhaft.
  • Bixby, seit diesem Jahr in Samsungs Galaxy S8 in Korea und den USA zu Hause, sehen die Experten als sehr amerikanisch, blond, geschminkt, mit lackierten Fingernägeln, Tattoos, jung und exaltiert.
Beurteilung der Stimmen von digitalen Sprachassistenten Angenehme Assistenten: So bewerten Nutzer die Qualität der Stimmen von Sprachassistenten. (© 2017 Statista)

Fazit

Der rasante Fortschritt bei der künstlichen Intelligenz war in den letzten Monaten teils so beeindruckend, dass die Fähigkeiten von Alexa, Siri, Cortana und Facebook M sehr schnell im Alltag spürbar werden. Dennoch muss der Sprachassistent in der Wirklichkeit mit Dialekten, Umgebungsgeräuschen und sprachlichen Eigenheiten klar kommen, schlechte Internetverbindungen verkraften oder schlicht Fragen beantworten, die die Cloud-Software nur halb verstanden hat oder die so mehrdeutig sind, dass sich keine einfache Antwort geben lässt. Und die Frage nach dem Datenschutz dieser stets zuhörenden Assistenten steht dabei auf einem ganz anderen Blatt.