(openPR) HEAD acoustics bringt VoCAS (Voice Control Analysis System) auf den Markt, die leistungsfähige Software zur Bewertung von Spracherkennungssystemen. Von der Sprachsteuerung in Fahrzeugen bis hin zur Verwendung von Sprachbefehlen bei Smartphones, Tablets oder Telefon-Hotlines: Automatische Spracherkennung (Automatic Speech Recognition; ASR) wird heute bereits in zahlreichen Anwendungen eingesetzt. Mit VoCAS lässt sich die Sprachqualität von ASR-Systemen objektiv und schnell bewerten – und das unter realistischen und reproduzierbaren Testbedingungen. Die Software berücksichtigt dabei entscheidende Faktoren wie beispielsweise Hintergrundgeräusche, Sprache oder den Dialekt des Sprechers, die die Qualität von Sprachbediensystemen maßgeblich beeinflussen. VoCAS erlaubt vordefinierte Testsequenzen für ASR-Systeme anzuwenden, um so deren Qualität zu bestimmen, Schwächen der Systeme zu analysieren und diese anhand der Ergebnisse zu optimieren.
Maßgeschneiderte, reproduzierbare und realistische Testsequenzen
Abhängig vom Messobjekt und dem gewünschten Testfall lässt sich in VoCAS die passende Testsequenz für ein Sprachbediensystem definieren. Von Sprachbefehlen zur Navigation im Fahrzeug („Navigiere mich zum Flughafen Düsseldorf“) bis zum Sprachbefehl für einen Anruf mit dem Mobiltelefon („Ruf Max Mustermann an“): Es können alle infrage kommenden Befehle zur Steuerung eines Sprachsystems bewertet werden. Dabei besteht jede Testsequenz aus verschiedenen Elementen und wird nacheinander durchlaufen.
Diese Elemente sind beispielsweise das Abspielen von Testsätzen oder Hintergrundgeräuschen, das Einbauen von Pausen, um eine akustische Rückmeldung vom Sprachbediensystem zu erhalten oder die Auswertung des Systems. Alle Elemente lassen sich flexibel anordnen, beliebig oft hinzufügen und individuell einstellen (Lautstärke, Länge etc.). Jede Testsequenz ist beliebig oft wiederholbar. Als Hintergrundgeräusch steht eine breite Auswahl realistischer Geräuschszenarien zur Verfügung (z. B. Cafeteria, Fahrzeug oder Bahnsteig). Der Anwender kann durch Auswahl verschiedener Parametersätze wie beispielsweise unterschiedlicher Sprecher, Sprachen, Hintergrundgeräusche, Zieladresse oder anzurufende Person, das zu untersuchende Gerät geführt prüfen.
Datenbank mit vorhandenen Sprachaufnahmen individuell erweitern
Für die Tests der unterschiedlichen Sprachbediensysteme sind Datenbanken mit passenden Sprachbefehlen notwendig. Audiodatenbanken in VoCAS sind durch den Import eigener Sprachaufnahmen individuell erweiterbar. Darüber hinaus bietet VoCAS einen integrierten Rekorder mit dem einfach und schnell individuelle Testsätze aufgenommen werden können. Größere Listen importierter oder aufgenommener Audiodateien können automatisiert zugeschnitten, gefiltert und auf definierte Sprachpegel gebracht werden. VoCAS bietet zudem die Möglichkeit jeder Sprachaufnahme Schlagworte manuell zuzuweisen. Oftmals gibt es Sprachaufnahmen, die inhaltlich denselben Befehl enthalten, die aber trotzdem in verschiedenen akustischen Varianten vorliegen, weil verschiedene Sprachen, Sprecherinnen bzw. Sprecher oder Dialekte für die Aufnahmen verwendet wurden. Mit Hilfe der vergebenen Schlagworte führt VoCAS den Anwender systematisch durch die gewünschten Varianten, erzeugt die passenden Messsequenzen und hilft damit den Überblick zu bewahren.
Testergebnisse einfach interpretierbar
VoCAS überzeugt zudem durch die übersichtliche Ergebnispräsentation. Sowohl eine prozentuale Darstellung (z. B. 60 % der Sprachbefehle erkannt, 40 % nicht erkannt) als auch die farbliche Akzentuierung sind zur optimalen Interpretation der Testergebnisse abrufbar. Ein direkter Vergleich verschiedener Sprachbediensysteme ist möglich. Alle verfügbaren Eigenschaften (Bsp. Aussage, Sprecher, Sprache, Hintergrundgeräusch) lassen sich für die Ergebnispräsentation selektieren. So kann der Anwender prüfen, bei welchem Testsatz und mit welchen Eigenschaften das Messobjekt den Test bestanden hat. Die Testergebnisse lassen sich zur weiteren Nachbearbeitung nach Microsoft® Excel® exportieren.
VoCAS ermöglicht schnelles Benchmarking verschiedener ASR-Systeme oder -Softwareversionen unter realistischen und reproduzierbaren Bedingungen. Die Analyse-Software ist mit anderen HEAD acoustics-Produkten kompatibel. Das Frontend MFE VI.1 zur Aufnahme und Überwachung der Sprachaufnahmen über den Kunstkopfmund sowie zur Mundentzerrung lässt sich über VoCAS bedienen. Darüber hinaus, sind die Geräuschsimulationssysteme 3PASS, HAE-BGN oder HAE-car über die Bedienoberfläche von VoCAS steuerbar.












