Wolfram Language

Inspeccione habla usando una red neuronal

Este ejemplo reconoce habla usando la función incorporada SpeechRecognize. Una red neuronal de Repositorio de redes neuronales Wolfram también se usa para transcribir una señal en una lista de caracteres.

Comience a partir de una señal de habla sintetizada.

Reconozca el habla en un objeto de audio.

Ahora, obtenga la red preentrenada de reconocimiento de habla.

Evalúe la red neuronal en el siguiente habla sintetizada. La red regresa una lista de caracteres reconocida a partir de una grabación de audio.

Una caracteres para obtener una versión preliminar del habla reconocida.

La red fue entrenada usando una pérdida CTC para mapear la lista de marcos a partir de la entrada a una lista de caracteres, tomando en cuenta el hecho de que una sola letra puede abarcar varios cuadros.

Usted puede visualizar la salida de la red justo antes de decodificar CTC para obtener las probabilidades de todas las letras en cualquier punto en el tiempo. El eje inferior está etiquetado con una decodificación intermedia obtenida tomando el carácter con la máxima probabilidad en cada cuadro.

Ejemplos relacionados

de en fr ja ko pt-br zh