Der Einsatz von automatisierter Spracherkennung im Kundendialog hat eine längere Tradition und ist reich an gescheiterten Beispielen, aber auch an aktuell marktfähigen Produkte wie Siri und Cortana. So hat der Autor selbst in den 90er Jahren mit Technologien der Firmen Lucent, Avaya und Voice Trust experimentiert, um den damals ausschließlich aus Telefonaten bestehenden Kundendialog im Direktbankengeschäft produktiver zu gestalten. So wurde u.a. überlegt, das Sprachprofil als eindeutigen Identifikations- und Authentifizierungsnachweis zu nutzen und damit die Abfrage/Eingabe von Kunden-/Kontonummer und PIN-Zahl obsolet zu machen. Bei diesen einfachen Anwendungsszenarien ist es im Wesentlichen geblieben und eine Weiterentwicklung konnte nur sporadisch erfolgen, da die Rechnerkapazitäten und die Akzeptanz des Kunden nur die akustische Sprachmustererkennung und einige semantische Informationen aus dieser performant verfügbar und in Kundenprozesse einsetzbar machten.
In den letzten 20 Jahren gab es dann nur wenige Fortschritte, obwohl sich der telefonische Kundenservice wacker hält und die Vermessung der Servicequalität – real-time wie ex-post – sich kontinuierlich verbessert hat. Der Siegeszug des Internets hat jedoch die Bedeutung der Sprache im Non-face-Kundendialog zurückgedrängt, so dass signifikante Investitionen ausblieben.
Das Aachener Start-up Psyware nimmt diesen Bereich der Customer Experience mit einem interessanten Angebot wieder auf. Für Lösungen im Kundenservice offeriert es das Produkt Precire, welches die emotionale Stimmungen und Parameter der Gesprächspartner quantifizierbar macht. Damit soll die Zuordnung zwischen „emotional kompatiblen“ Agenten und Kunden gelingen und damit die Basis für ein erfolgreiches Kundengespräch gelegt werden. Auch die Auswertung der Gesprächsatmosphäre ex-post ist damit möglich und neben den klassischen Call Center-Parametern wie bspw. Gesprächszeit, Annahmequote werden damit real-time qualitative Aussagen über die tatsächliche Gesprächs-Servicequalität im Call Center möglich. Weiter Spielarten und Einsatzgebiete ergeben sich bei weiterer Betrachtung schnell.
Technologie
Technologisch baut die Idee auf den von klinischen Psychologen James Pennebaker von der University of Texas in der 1980er Jahren gelegten Grundlagen auf, welcher die Sprache von Trauernden analysierte und quantitativ deren Veränderung maß. Mit den aktuellen Methoden des Big Data und Machine Learnings stehen nun die erforderlichen Ressourcen bereit, um konkrete Anwendungen zu etablieren. Wortwahl und Sprechweise jedes Menschen beeinflussen individuell dessen Gesprächsverhalten. Precire analysiert formal-quantitativ den gesprochenen Text, welcher durch eine Sprachsynthese maschinenlesbar gemacht wird und kombiniert diesen mit prosodischen Merkmalen. Die entstandenen Sprachmuster werden schließlich unterschiedlichen linguistischen und psychologischen Kategorien zugeordnet, die für die Vorhersage bestimmter Merkmale relevant sind und mit einer großen Zahl von Probanden kalibriert wurden. Der Vergleich und die mathematische Analyse sollen dann auch nicht triviale Zusammenhänge offenlegen.
Praxisbezug
Die Wirtschaft setzt hohe Erwartungen in die Technologie. So soll eine Versicherung bereit sein, diese in ihren Kundendialog als Analysewerkzeuge zu integrieren. Auch Personalberatungsfirmen versprechen sich – ausweislich der Referenzliste von Psyware – viel Effizienzpotenzial davon, obwohl mancher Referenzgeber die Technologie wieder relativiert.
Soweit die Technologie die genannten Erwartungen erfüllt, kann sie sicher wieder einen Innovationsschub im sprachbasierten Kundendialog bringen. Die weiteren Einsatzfelder wie Personalauswahl und medizinische Therapieunterstützung (z.B. die Erkennung von Angstzuständen durch Krankenkassen) sind gesondert zu bewerten.