Nutzer können mitmachen 01.12.2017, 10:14 Uhr

Sprachsteuerung: Mozilla veröffentlicht Datenbank

Ob Amazons Alexa, Googles Assistant oder Cortana von Microsoft: Assistenten zur Spracherkennung und -steuerung werden von Unternehmen dominiert, die ihre Projekte isoliert vorantreiben und teils allerlei Nutzerdaten sammeln. Nun soll eine Open-Source-Alternative kommen.
(Quelle: Andrey_Suslov-shutterstock)
Die Mozilla-Stiftung hat eine frei zugängliche Sprachdatenbank (Common Voice) und ein quelloffenes Programm zur Spracherkennung (DeepSpeech-Engine) veröffentlicht. Beides darf jedermann für eigene Dienste zur Spracherkennung und -steuerung nutzen oder weiterentwickeln.
Die aus dem Common-Voice-Projekt resultierende Sprachsammlung enthält derzeit rund 400 000 Aufnahmen von 200 000 unterschiedlichen Menschen, was ungefähr 500 Stunden an Sprachaufnahmen entspricht - und wächst weiter. Es handelt sich nach Angaben von Mozilla um den zweitgrößten offenen Sprachdatensatz nach dem LibriSpeech-Projekt.
Nutzer können via iPhone-App und Browser weiter zum Anwachsen der Common-Voice-Datenbank beitragen, indem sie Sätze vorlesen, die dann aufgezeichnet werden - in der Hoffnung, dass daraus datenschutzfreundliche Dienste rund um die Spracherkennung und Sprachsteuerung erwachsen. Aktuell laufen die Projekte nur auf Englisch, andere Sprachen sollen den Angaben zufolge aber schon bald unterstützt werden.
Positiv unter Datenschutzaspekten: Die Mozilla-Entwicklungen funktionieren auch ohne ständige Internetverbindung.
Mozilla selbst gibt an, darüber nachzudenken, Sprachschnittstellen auf Basis von Common Voice und DeepSpeech in vielen Mozilla-Produkten einzusetzen, darunter auch im Firefox-Browser.



Das könnte Sie auch interessieren