Der Einsatz von automatisierter Spracherkennung im Kundendialog hat eine längere Tradition und ist reich an gescheiterten Beispielen, aber auch an aktuell marktfähigen Produkte wie Siri und Cortana. So hat der Autor selbst in den 90er Jahren mit Technologien der Firmen Lucent, Avaya und Voice Trust experimentiert, um den damals ausschließlich aus Telefonaten bestehenden Kundendialog im Direktbankengeschäft produktiver zu gestalten. So wurde u.a. überlegt, das Sprachprofil als eindeutigen Identifikations- und Authentifizierungsnachweis zu nutzen und damit die Abfrage/Eingabe von Kunden-/Kontonummer und PIN-Zahl obsolet zu machen. Bei diesen einfachen Anwendungsszenarien ist es im Wesentlichen geblieben und eine Weiterentwicklung konnte nur sporadisch erfolgen, da die Rechnerkapazitäten und die Akzeptanz des Kunden nur die akustische Sprachmustererkennung und einige semantische Informationen aus dieser performant verfügbar und in Kundenprozesse einsetzbar machten.
In den letzten 20 Jahren gab es dann nur wenige Fortschritte, obwohl sich der telefonische Kundenservice wacker hält und die Vermessung der Servicequalität – real-time wie ex-post – sich kontinuierlich verbessert hat. Der Siegeszug des Internets hat jedoch die Bedeutung der Sprache im Non-face-Kundendialog zurückgedrängt, so dass signifikante Investitionen ausblieben.
Das Aachener Start-up Psyware nimmt diesen Bereich der Customer Experience mit einem interessanten Angebot wieder auf. Für Lösungen im Kundenservice offeriert es das Produkt Precire, welches die emotionale Stimmungen und Parameter der Gesprächspartner quantifizierbar macht. Damit soll die Zuordnung zwischen „emotional kompatiblen“ Agenten und Kunden gelingen und damit die Basis für ein erfolgreiches Kundengespräch gelegt werden. Auch die Auswertung der Gesprächsatmosphäre ex-post ist damit möglich und neben den klassischen Call Center-Parametern wie bspw. Gesprächszeit, Annahmequote werden damit real-time qualitative Aussagen über die tatsächliche Gesprächs-Servicequalität im Call Center möglich. Weiter Spielarten und Einsatzgebiete ergeben sich bei weiterer Betrachtung schnell.
Technologie
Technologisch baut die Idee auf den von klinischen Psychologen James Pennebaker von der University of Texas in der 1980er Jahren gelegten Grundlagen auf, welcher die Sprache von Trauernden analysierte und quantitativ deren Veränderung maß. Mit den aktuellen Methoden des Big Data und Machine Learnings stehen nun die erforderlichen Ressourcen bereit, um konkrete Anwendungen zu etablieren. Wortwahl und Sprechweise jedes Menschen beeinflussen individuell dessen Gesprächsverhalten. Precire analysiert formal-quantitativ den gesprochenen Text, welcher durch eine Sprachsynthese maschinenlesbar gemacht wird und kombiniert diesen mit prosodischen Merkmalen. Die entstandenen Sprachmuster werden schließlich unterschiedlichen linguistischen und psychologischen Kategorien zugeordnet, die für die Vorhersage bestimmter Merkmale relevant sind und mit einer großen Zahl von Probanden kalibriert wurden. Der Vergleich und die mathematische Analyse sollen dann auch nicht triviale Zusammenhänge offenlegen.
Praxisbezug
Die Wirtschaft setzt hohe Erwartungen in die Technologie. So soll eine Versicherung bereit sein, diese in ihren Kundendialog als Analysewerkzeuge zu integrieren. Auch Personalberatungsfirmen versprechen sich – ausweislich der Referenzliste von Psyware – viel Effizienzpotenzial davon, obwohl mancher Referenzgeber die Technologie wieder relativiert.
Soweit die Technologie die genannten Erwartungen erfüllt, kann sie sicher wieder einen Innovationsschub im sprachbasierten Kundendialog bringen. Die weiteren Einsatzfelder wie Personalauswahl und medizinische Therapieunterstützung (z.B. die Erkennung von Angstzuständen durch Krankenkassen) sind gesondert zu bewerten.
Quellen und weiterführende Informationen
58 Einträge « ‹ 2 von 2
› » Mike Orcutt
The Do-Not-Call List Has a Gaping Hole Artikel
In: MIT Technology Review, 2016.
@article{Orcutt:2016aa,
title = {The Do-Not-Call List Has a Gaping Hole},
author = {Mike Orcutt},
url = {https://www.technologyreview.com/s/602284/the-do-not-call-list-has-a-gaping-hole/},
year = {2016},
date = {2016-09-02},
journal = {MIT Technology Review},
abstract = {Illegal robocalls that try to scam you out of money are flourishing. Can the phone companies figure out how to stop them?},
keywords = {},
pubstate = {published},
tppubtype = {article}
}
Illegal robocalls that try to scam you out of money are flourishing. Can the phone companies figure out how to stop them?
Christine Straßer
Winzige Wörter verraten den Charakter Artikel
In: Mittelbayerische Zeitung, 2016.
@article{Straser:2016aa,
title = {Winzige Wörter verraten den Charakter},
author = {Christine Straßer},
url = {http://www.mittelbayerische.de/bayern-nachrichten/winzige-woerter-verraten-den-charakter-21705-art1181283.html},
year = {2016},
date = {2016-01-24},
journal = {Mittelbayerische Zeitung},
abstract = {Eine neue Software analysiert anhand der Sprache die Persönlichkeit des Sprechers. Ein Regensburger Forscher arbeitet mit.},
keywords = {},
pubstate = {published},
tppubtype = {article}
}
Eine neue Software analysiert anhand der Sprache die Persönlichkeit des Sprechers. Ein Regensburger Forscher arbeitet mit.
Pia Lorenz
Precire weiß, was Du letzten Sommer getan hast Artikel
In: Legal Tribune Online, 2015.
@article{Lorenz:2015aa,
title = {Precire weiß, was Du letzten Sommer getan hast},
author = {Pia Lorenz},
url = {http://www.lto.de/recht/job-karriere/j/kuenstliche-intelligenz-legal-tech-precire-persoenlichkeitstest/},
year = {2015},
date = {2015-11-27},
journal = {Legal Tribune Online},
abstract = {15 Minuten Telefonat mit einer Maschine sollen den perfekten Mitarbeiter finden. Ihre Mails sollen Unternehmen verraten, was Kunden glücklich macht. Persönlichkeitsmerkmale und Gesundheitsrisiken, per Sprache analysiert? Ein Selbstversuch.},
keywords = {},
pubstate = {published},
tppubtype = {article}
}
15 Minuten Telefonat mit einer Maschine sollen den perfekten Mitarbeiter finden. Ihre Mails sollen Unternehmen verraten, was Kunden glücklich macht. Persönlichkeitsmerkmale und Gesundheitsrisiken, per Sprache analysiert? Ein Selbstversuch.
Stéphane H. Maes; Ji Navrátil; Upendra V. Chaudhari
Conversational Speech Biometrics Buchkapitel
In: Liu, Jiming; Ye, Yiming (Hrsg.): E-Commerce Agents: Marketplace Solutions, Security Issues, and Supply and Demand, S. 166–179, Springer Berlin Heidelberg, Berlin, Heidelberg, 2001, ISBN: 978-3-540-45370-3.
@inbook{Maes2001,
title = {Conversational Speech Biometrics},
author = {Stéphane H. Maes and Ji Navrátil and Upendra V. Chaudhari},
editor = {Jiming Liu and Yiming Ye},
url = {http://dx.doi.org/10.1007/3-540-45370-9_10},
doi = {10.1007/3-540-45370-9_10},
isbn = {978-3-540-45370-3},
year = {2001},
date = {2001-04-25},
booktitle = {E-Commerce Agents: Marketplace Solutions, Security Issues, and Supply and Demand},
pages = {166--179},
publisher = {Springer Berlin Heidelberg},
address = {Berlin, Heidelberg},
abstract = {This paper discusses a new modality for speaker recognition - conversational biometrics - as a high security voice-based authentication method for E-commerce applications. By combining diverse simultaneous conversational technologies, high accuracy transparent speaker recognition becomes possible even in channel or environment mismatches. For speaker identification over very large populations, we combine dialogs to reduce the set of confusable speakers and text-independent speaker identification to pin-point the actual speaker. Similarly, dialogs with personal random or predefined questions are used to perform simultaneously knowledge-based and acoustic-based verifications of the user. Adequate design of the dialog allows to tailor the ROC curves to the needs of most applications. We demonstrate the conceptual advantages using our telephony prototype. Users familiar with the system can log into the system with 0.8% or 1.3% false rejection and ca. 5 • 10−12% or 2 • 10−6% false acceptance rates in about 40 sec or 20 sec respectively which is an impressive result as compared to purely voice-print based authentication.},
keywords = {},
pubstate = {published},
tppubtype = {inbook}
}
This paper discusses a new modality for speaker recognition - conversational biometrics - as a high security voice-based authentication method for E-commerce applications. By combining diverse simultaneous conversational technologies, high accuracy transparent speaker recognition becomes possible even in channel or environment mismatches. For speaker identification over very large populations, we combine dialogs to reduce the set of confusable speakers and text-independent speaker identification to pin-point the actual speaker. Similarly, dialogs with personal random or predefined questions are used to perform simultaneously knowledge-based and acoustic-based verifications of the user. Adequate design of the dialog allows to tailor the ROC curves to the needs of most applications. We demonstrate the conceptual advantages using our telephony prototype. Users familiar with the system can log into the system with 0.8% or 1.3% false rejection and ca. 5 • 10−12% or 2 • 10−6% false acceptance rates in about 40 sec or 20 sec respectively which is an impressive result as compared to purely voice-print based authentication.
Jo Bager
V-Commerce: E-Commerce mit der Stimme Artikel
In: heise.de, 1998.
@article{Bager:1998aa,
title = {V-Commerce: E-Commerce mit der Stimme},
author = {Jo Bager},
url = {https://heise.de/-15159},
year = {1998},
date = {1998-10-07},
journal = {heise.de},
abstract = {Geschäftliche elektronische Transaktionen sollen sich in Zukunft auch mit der Stimme erledigen lassen. Spracherkennende Computer sollen es ermöglichen, im Web oder per Telefon Überweisungen oder Bestellungen mit Sprachbefehlen in Auftrag zu geben. Um hierfür einheitliche Standards zu schaffen, haben sich Hersteller von Spracherkennungs- und E-Commerce-Produkten zur V-Commerce Alliance zusammengeschlossen. Auf der New Yorker Internet World hat sich die Allianz erstmals einer breiten Öffentlichkeit vorgestellt.},
keywords = {},
pubstate = {published},
tppubtype = {article}
}
Geschäftliche elektronische Transaktionen sollen sich in Zukunft auch mit der Stimme erledigen lassen. Spracherkennende Computer sollen es ermöglichen, im Web oder per Telefon Überweisungen oder Bestellungen mit Sprachbefehlen in Auftrag zu geben. Um hierfür einheitliche Standards zu schaffen, haben sich Hersteller von Spracherkennungs- und E-Commerce-Produkten zur V-Commerce Alliance zusammengeschlossen. Auf der New Yorker Internet World hat sich die Allianz erstmals einer breiten Öffentlichkeit vorgestellt.
Pindrop (Website) url
0000.
@url{WebsitePindrop,
title = {Pindrop (Website)},
url = {https://www.pindrop.com},
keywords = {},
pubstate = {published},
tppubtype = {url}
}
Psyware (Website) url
0000.
@url{PsywareWebsite,
title = {Psyware (Website)},
url = {https://www.psyware.de},
keywords = {},
pubstate = {published},
tppubtype = {url}
}
Lyrebird
Homepage Lyrebird Sonstige
0000.
@misc{Lyrebird,
title = {Homepage Lyrebird},
author = {Lyrebird},
url = {https://lyrebird.ai},
urldate = {2018-01-29},
abstract = {Das kanadische Start-up Lyrebird hat eine Software entwickelt, die in wenigen Minuten lernt, beliebige Stimmen nachzumachen.},
keywords = {},
pubstate = {published},
tppubtype = {misc}
}
Das kanadische Start-up Lyrebird hat eine Software entwickelt, die in wenigen Minuten lernt, beliebige Stimmen nachzumachen.
58 Einträge « ‹ 2 von 2
› »
Weitere Quellen zu Kunden-Erkennungstechnologien/Retail Surveillance
Es sind leider keine Einträge vorhanden.