Desconozco las técnicas más actuales, pero se puede inducir una; cuando se utilizaba el Dragon Speak u otros uno debía dictarle una y otra vez un párrafo CONOCIDO al programa, hasta que el mismo reconozca tu voz. Esto significa que al dictarle una y otra vez el programa creaba asociaciones entre una onda y una frase finalmente desglosada en una palabra.
Con tal idea tenemos una palabra "hola" equivaldría a un vector, el cual posteriormente puede ser comparado con otro vector ya reconocido... el cual diferencia/error mínima equivaldria a la palabra que "suena como" más aproximada.
Saludos
|