Wolfram Language

Sprache erkennen

Unter automatisierter Spracherkennung (Automatic Speech Recognition, ASR), auch bekannt als Speech-to-Text (STT), versteht man das automatisierte Erkennen und Umwandeln von gesprochener Sprache in schriftlichen Text. Spracherkennung wird vor allem in umfangreichen automatisierten Transkriptionssystemen, bei virtuellen Assistenten und smarten Haushaltsgeräten, sprachfähigen Kontrollsystemen, Diktiersystemen, automatischen Telefonsystemen etc. eingesetzt.

Version 12 ermöglicht automatisierte Spracherkennung mit SpeechRecognize.

Hier ist eine Sprachdatei aus dem Internet.

Visualisieren Sie das Spektrogramm der Datei.

Und hier ist das Resultat der Spracherkennung dieses Signals. Bei der Spracherkennung berechnet ein neuronales Netz ein Rohtranskript des Signals, das dann mithilfe eines Sprachmodells in Hinblick auf Rechtschreibfehler und andere Faktoren korrigiert wird.

Verwandte Beispiele

en es fr ja ko pt-br zh