Diese Seite:

Microsoft erzielt Durchbruch bei Spracherkennung

makrohaus Newsletter - September 2011

Im Rahmen der Interspeech 2011 haben Forscher von Microsoft Research ihre jüngste Arbeit vorgestellt, die einen Durchbruch auf dem Gebiet der Spracherkennung darstellen soll.

Üblicherweise werden Softwareprogramme zur Spracherkennung so lange trainiert, bis sie ihren Nutzer in allen Situationen gut verstehen können. Leider sieht die Praxis aber ganz anders aus, bzw. ist dies nicht immer so möglich, da ein System oft mit sehr vielen Menschen zu tun hat (Bsp. Telefon-Hotline mit sprachgesteuertem Menü). Diese System besitzen nur einen sehr geringen Wortschatz, verstehen die Wörter allerdings aber auch in schwierigen Situationen.

Jetzt haben Microsoft Forscher Methoden erforscht, um eine Spracherkennung unabhängig vom Sprecher entwickeln zu können die über einen großen Wortschatz verfügt. Optimal wäre ein System, welches sämtliche Wörter verstehen kann, egal aus wessen Mund sie kommen - ohne langes Training.

Zum optimalen trainieren einer Spracherkennung würden sich aktuell Smartphones eignen. Hier müssen jedoch erst genügend Erfahrungswerte gesammelt werden.

Aktuell greifen die Microsoft Forscher auf ein älteres, bekanntes mathematisches Modell zur Abbildung von Nervenbahnen im menschlichen Gehirn zurück. Dieses Modell erweiterten sie in diversen Bereichen, um eine verbesserte Performance erzielen zu können.

Bislang arbeiteten die Forscher mit Phonemen, den kleinsten sprachlichen Einheiten, die in der gesprochenen Sprache vorkommen (ca. 30 Stück). Nun schafften die Forscher aber den Durchbruch indem sie noch kleinere Laute verwenden, die im Englischen als "senones" bekannt sind (Anzahl im vierstelligen Bereich). Dadurch kann die Spracherkennung wesentlich zuverlässiger arbeiten.

Nach gut 50 Jahren Forschung im Bereich der Spracherkennung bedeutet diese Verbesserung einen wahren Quantensprung. In Zukunft werden die Systeme wesentlich flüssiger funktionieren.

vgl. Winfuture - online (31.08.2011)