2018-10-06 07:22:38

"Alexa, sei endlich mal still oder sprich mit jemand anderem!“

Wenn die Hersteller ihre Sprachtechnologie den Benutzer vorsetzen und diese sich für ein bestimmtes System entscheiden müssen, dann sollte das System auch sehr gut funktionieren.

Sollte Oscar Wilde mit seinem Spruch "das Leben imitiert die Kunst" Recht haben, dann sollte die Technologiewelt Stanley Kubrick und nicht Steve Jobs feiern. Derr Apple-Gründer hat sich die Idee der Computermaus und der grafischen Benutzeroberfläche bei Xerox PARC abgeschaut und diese Technologiemonster in den Mac integriert, aber es war Kubricks in seinem Film "2001: A Space Odyssey", der die Idee der Interaktion mit Computern über Sprache populär machte. Der Chat mit HAL (eigentlich IBM – nur die Buchstaben im Alphabet um eine Stelle nach links verrutscht) ist zwar als großartiger filmischer Effekt den Leuten in Erinnerung geblieben, aber diese Filmsequenz liefert nicht unbedingt eine nützliche Mensch-Maschine-Schnittstellen, die die Unternehmen nutzen können.

In meiner langen Karriere in der Technologie habe ich die Erkenntnis gewonnen, dass unsere Fähigkeit, etwas zu tun, absolut keinen Bezug dazu haben muss, ob es umgesetzt wird. Dieses Prinzip sollten wir uns vor Auge halten, wenn wir überlegen, wie wir die Benutzerinteraktion von Unternehmensanwendungen gestalten.

Wenn man die Nutzung der Benutzeroberfläche im mobilen Bereich durch die Verbraucher (d.h. dem Bereich, aus dem die meisten neuen Ideen stammen) analysiert, dann ist "Spaß" ein häufig benutztes Wort. Seit der Einführung von Point and Click auf Basis der Wunder von Touchscreens erfreuen sich die Benutzer über jede neue Art und Weise, wie sie mit ihrer persönlichen Technologie interagieren können. Die Touch-Technologie gehören heute zu den Alltagsgegenständen und die haptischen Engines ermöglichen unseren Geräten, dass diese still und leise im Hintergrund arbeiten können. Selbst Sicherheitsbereich hat sich durch diese Technologie der Zugang zu den Geräten - von den Anfängen (keine Sicherheit) über Passcodes bis hin zu Fingerabdrücken und zur Gesichtserkennung - weiterentwickelt.

Die Grenzen des unternehmensgerechten Spaßes haben erreicht, als wir die Spracherkennung nutzen sollten. Meine anfänglich Zurückhaltung in Sachen „Spracherkennung“ beruhte auf der Tatsache, dass die ersten Lösungen einfach nicht gut funktionierten. Selbst bei grundlegenden Dingen wie der Zahlenerkennung, musste man immer wieder beten, dass das System die Möglichkeit der Toneingabe auch wirklich umsetzen konnte.

Inzwischen sagen uns die Forscher, dass die Technologie inzwischen in der Lage ist, mehr als 95 Prozent aller Spracheingaben korrekt zu verstehen. Die Industrie hat jedoch den Einsatz schon wieder erhöht und schraubt die Erwartung an die Technik durch eine „natürliche Sprachverarbeitung“ (Natural Language Processing; NLP) noch höher. Die Technologie soll in der Lage sein, einen natürlicheren Dialog zwischen Mensch und Maschine zu unterstützen. Apple führte die NLP-Entwicklung mit Siri an, fiel aber schnell durch schlechte Lösungen zurück. Inzwischen stellen Amazons Alexa, Googles Assistant und sogar Microsofts Cortana die Fragen des Herrn Kubrick an HAL.

Wie die meisten Techniker meiner Generation bin ich in meinem Büro von einer Menge an Technik umgeben. Mit diesen Systemen interagiere ich täglich tausende Mal. Ich stelle auch keine besonderen Erwartungen an meine Arbeitsmittel. Ich will, dass diese Systeme einwandfrei funktionieren. Ich muss meine Arbeit und Aufträge erledigen, und nichts pumpt meinen Blutdruck schneller in die Höhe, als ein Werkzeuge, das nicht richtig funktioniert. Meine Kunden wollen Ergebnisse sehen und legen keinen Wert darauf, dass ich diese in einer Umgebung produzieren kann, die sie an einen Science-Fiction-Film aus den 1960er Jahre erinnert.

Wenn ich zu Hause zufällig mit meinen technischen Spielzeugen herumspiele, kann ich meine Frau immer wieder an einigen Alexa-Tricks erfreuen. Um ehrlich zu sein, ich erarbeite mir diese Tricks nicht, sondern erhalte diese aus diesen E-Mails, die mir Amazon schickt). Aber der Unterhaltungswert dieser Tricks schwindet schnell. Auch sollte man nicht auf die Idee kommen, dieses Zeug seinen Freunden zu zeigen, wenn man seine Freunde behalten will. Am Ende nutzen meine Frau und ich die Spracherkennung aus einem Grund: Wir sind zu bequem um auf den Touchscreen zu tippen.

Es gibt Fälle, in denen eine Sprachschnittstelle in einem Unternehmen notwendig wird. Wenn beispielsweise ein Menschen Daten eingeben muss, aber die Hände für eine andere Tätigkeit nutzt. Diese Fähigkeit kann auch in industriellen Umgebungen nützlich sein, wenn ein Arbeitnehmer seinen Verstand gebraucht, um Gefahren zu vermeiden. Diese Funktionen können eventuell in bestimmten Arbeitsumgebungen von Nutzen sein, aber welche Funktionen lassen sich für den Bürobereich davon ableiten? In einer Keynote zu Enterprise Connect 2018 kam Amazon Web Services auf die Idee, Alexa zum Einloggen in Audio-, Video- und Webkonferenzen zu nutzen und dadurch die Komplexität des Zugangs zu diesen Systemen zu reduzieren. Auf Basis von Alexa Skills können Benutzer ihr eigenes Vokabular und ihre eigene Verwendung definieren und somit die NLP-Leistung der Geräte verbessern. Dies provoziert jedoch die Frage, wie hoch die Wahrscheinlichkeit ist, dass eine wesentlich komplexere Lösung, durch eine Sprachsteuerung verbessert wird?

Die große Herausforderung für die Technik ist immer noch der Menschen. Es ist wichtig, uns daran zu erinnern, dass wir die Menschen umschulen können. Niemand wusste, wie man mit der Point-und-Klick-Technologie umging, bis wir über eine Maus verfügten. Danach hatten wir den Sinn dieser Technik verinnerlicht. Dasselbe gilt für das Wischen, das Streicheln, und Spreizen und die vielen interaktiven Elemente, die wir in die modernen Anwendungen integriert haben. …. Außerdem haben wir die Nutzer sogar so weit gebracht, dass sie jeden Satz mit "Alexa" beginnen.

Dabei sollten wir uns daran erinnern, dass wir in einem Geschäftsumfeld arbeiten und die Menschen bestimmte Aufgaben erledigen müssen. Dazu müssen wir den Menschen entsprechende Werkzeuge bereitstellen, die dazu beitragen, dass zumindest einige Teile dieser Aufgaben einfacher erledigt werden. Wenn ein Werkzeug mehr Ärger macht, als es wert ist, werden die Menschen dieses nicht nutzen und diese weiterhin ignorieren.

log

Druckversion