Thesis
Técnicas para el reconocimiento de voz en palabras aisladas en la lengua náhuatl
Fecha
2010-12-08Registro en:
Flores Paulín, Juan Carlos. (2009). Técnicas para el reconocimiento de voz en palabras aisladas en la lengua náhuatl. (Maestría en Ciencias en Ingeniería de Cómputo con Opción en Sistemas Digitales). Instituto Politécnico Nacional, Centro de Investigación en Computación, México.
Autor
Flores Paulín, Juan Carlos
Institución
Resumen
ABSTRACT RESUMEN: El reconocimiento de voz, como medio de comunicación entre dispositivos automáticos y el ser humano, es una gran expectativa que ha aumentado durante las últimas tres décadas. Ejemplos de algunos sistemas controlados por medio de voz son: el marcado telefónico, el control de elementos mecánicos o robóticos, la selección de servicios mediante palabras en los coches, pedir y navegar por Internet, etc. El uso de este tipo de tecnología puede crear la posibilidad de que la población en general (incluyendo personas étnicas y/o con discapacidad física) puedan usar las computadoras y/o equipos, para el manejo de transacciones, mensajes, información y control de varios dispositivos.
El propósito de este trabajo es mostrar los resultados obtenidos en la aplicación de técnicas de reconocimientos de voz que se aplican a la lengua Náhuatl. La lengua Náhuatl no es la única lengua autóctona en México, pero es la que más se habla y por lo regular las personas que hablan estos idiomas son generalmente analfabetas.
La lengua Náhuatl, que comprende alrededor de 43 variantes, es una de las más importantes. Es por esto que, la conservación del idioma es importante porque el lenguaje es el medio más eficaz de transmitir una cultura, y son los propietarios de esa cultura los que más pierden cuando una lengua muere.
Los principales parámetros que se analizan en este trabajo son los Codificadores predictivos lineales y los coeficientes cepstrales en la escala de Mel.
Las técnicas empleadas son: Cuantificación vectorial, modelos ocultos de Markov discretos y de densidad continua, además de una aplicación que utiliza redes neuronales artificiales. Siendo la técnica de modelos ocultos de Markov de densidad continua que utiliza coeficientes cepstrales en escala de Mel la que alcanzó un 99% de exactitud en un corpus de dígitos provenientes de la lengua Náhuatl.