Thesis
rototipo de un reconocedor de voz para el idioma español
Autor
Castro Briceño, David Alejandro
Institución
Resumen
RESUMEN
Actualmente en el área de reconocimiento de voz se han producido grandes avances, que han permitido la reducción de la tasa de errores y la independencia del hablante. Un beneficio que presentan estas
aplicaciones de reconocimiento se encuentra en el área de la telefonía, ya que permiten la interacción de una persona a través del teléfono usando comandos de voz para poder navegar a través de un sistema. El problema que tienen estas aplicaciones, y más para el lenguaje español, es la poca disponibilidad de
sistemas que hay en el mercado, donde la gran mayoría no están disponibles al público general. Otro punto en contra para el reconocimiento de voz en español es la falta de corpus de entrenamiento que
permitan hacer sistemas lo suficientemente robustos a bajo costo. Tomando en cuenta la situación actual del reconocimiento de voz para el español, en este trabajo se
propone la construcción de un prototipo de reconocimiento de palabras aisladas, usando las bondades que pueden aportar los modelos ocultos de Markov, haciendo uso de plataformas open source tanto para el entrenamiento de los modelos, como para el reconocimiento de la señal de voz..
Entre los resultados obtenidos con los modelos construidos se logró un reconocimiento efectivo de 83.1% y 91.63%, en base a los criterios de evaluación definidos, con grabaciones de audio en situaciones reales. A su vez se logró la integración exitosa con una aplicación telefónica para pruebas en vivo. En conclusión, fue posible la construcción de los modelos, que luego de varios ajustes, obtuvieron buenos niveles de reconocimiento, junto con una
integración exitosa en sistemas de telefonía para su uso en aplicaciones del mundo real.
Palabras claves: Reconocimiento de voz, modelos ocultos de markov, aplicaciones en telefonía. TUTOR: Prof. Haydemar Nuñez ; Prof. Esmeralda Ramos