Es gibt verschiedene Bezeichnungen für diesen Voice-Bereich, VUI (Voice-User- Interface), VUX (Voice-User-Experience) oder Conversational Design. Wir nutzen vorwiegend die Bezeichnung Voice-Design oder VUI, aber im Grunde sagen alle das Selbe aus.
Den Aufbau einer Voice-App (z. B. eines Skills bei Alexa), also das Voice-User- Interface (VUI) Design, sieht man in der Regel nicht. Dabei ist dies eines der wichtigsten Instrumente und essenziellen Grundbausteine einer Anwendung.
Diese können sehr beeindruckend wirken, wenn man mal hinter die Kulissen schauen darf:
Dieser Skill bildet zwei Wege ab. Den ersten über einen „Schritt-für-Schritt“-Generator und den zweiten für eine direkte Auswahl in vier verschiedenen Kategorien.
Dieser Skill ist zwar auf den ersten Blick sehr klein, aber dahinter verbirgt sich eine Bestell-Voice-App um Kaffee zu ordern.
Die Screenshots zeigt jedoch nur einen kleinen Ausschnitt, denn das Interface besteht nicht nur aus den Auswahlmöglichkeiten. Verschiedene Flows (Zweigwege z. B. für Hilfe-Anwendungen) im „Hintergrund“ der App, fangen wichtige Nebenfragen ab, die es in jedem Bereich gibt, nicht nur in der Voice-Welt.
Im persönlichen Beratungsgespräch ist es z. B. die nebenbei gestellte Frage nach der Gewährleistung. Auf der Webseite die FAQs und auf Social-Media-Plattformen die Einstellungsmöglichkeiten.
Der „Hilfe-Flow“ kann zu jeder Zeit, während der Verwendung der App, aktiviert werden, z. B. durch die Standard-Aussagen wie „Hilfe“, „Stopp“ oder „Abbrechen“. Auch diese Wege sind im Voice-Interface sehr wichtig und sollten immer an das Branding der App angepasst sein. Wir empfehlen diese sogar weiter auszubauen, um den Nutzern den Servicegedanken auch in der Voice-App widerzuspiegeln.
Nichts ist enttäuschender, als wenn der User in einen für ihn nicht abgegrenzten Bereich in der App gelangt, in der plötzlich anders mit ihm gesprochen wird. Der „Zauber“ verschwindet quasi und der Anwender ist aus seiner Journey herausgerissen. Das führt ganz oft zu Abbrüchen der App und ggf. zu schlechten oder schlechteren Bewertungen.
Die Flows sollten also auch sehr eng in das User Interface eingebunden sein und genauso viel Beachtung erhalten, wenn nicht sogar etwas mehr als die „Kern-App“.
Hinter jeder guten Voice App steckt also ein gutes Voice User Interface Design. Aber warum ist das noch wichtig?
In der Regel ist bei der Nutzung von Sprachassistenten keine visuelle Hilfe verfügbar, d.h. Nutzer sind vollkommen vom Gehörten abhängig, um Entscheidungen zu treffen. Sie müssen in jedem Schritt nachvollziehen können, was passiert und was sie im nächsten Moment sagen können.
Eine zu lange Stille löst in jeder Konversation Unbehagen aus. Daher ist es wichtig jeden Moment des Interfaces gut zu planen. Den Nutzer mit 10 Optionen zu konfrontieren ist genauso zäh, wie zu wenig Möglichkeiten zur Verfügung zu stellen. Bis alle Varianten aufgesagt sind, hat der User die ersten 7 bereits wieder vergessen oder ärgert sich, weil seine Ansagen nicht zum gewünschten Ergebnis führen.
Das VUI der Voice-App sollte daher als eine Persönlichkeit aufgebaut sein. Denn für die Nutzer zeichnet sich für die unsichtbaren netten Stimmen in der Phantasie ein Bild ab. So läßt sich diesem fiktiven Gegenüber durchaus sehr gezielt eine tatsächliche Persönlichkeit verleihen.
Diese Möglichkeiten werden z.B. im Vergleich zu Kinder-Voice-Apps gut sichtbar. Eine Anwendung für Kinder gestaltet sich immer anders als eine App für Erwachsene. Die KI wird mit ganz anderen Inhalten gefüllt, die Wege sind anders erklärt und gestaltet.
Eine gutes VUI beinhaltet also auch immer eine Beschreibung für die Persönlichkeit der KI. Merkmale, Sprachgebrauch und Wirkung in bestimmten Situationen werden vorab festgelegt, z. B. das Einbauen von Humor oder die Verwendung von Audio-Einspielungen anstelle der „Standard-Alexa-Stimme“.
Ein Voice-Interface ist somit nicht nur reine Technik. Es steckt auch sehr viel Feingefühl und Psychologie dahinter.
Kommen wir aber zum er...