dc.contributorJosé Ismael de la Rosa Vargas
dc.contributorArturo Moreno Baez
dc.creatorSoto Murillo, Manuel Alejandro
dc.date.accessioned2020-04-20T19:32:44Z
dc.date.accessioned2022-10-14T15:12:00Z
dc.date.available2020-04-20T19:32:44Z
dc.date.available2022-10-14T15:12:00Z
dc.date.created2020-04-20T19:32:44Z
dc.date.issued2018-03-09
dc.identifierhttp://ricaxcan.uaz.edu.mx/jspui/handle/20.500.11845/1786
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/4246278
dc.description.abstractEl reconocimiento de voz es un área de investigación del procesamiento digital de señales con un amplio campo de aplicaciones en diversos sistemas y dispositivos electrónicos, en los que la interacción humano-máquina es deseable o indispensable mediante comandos de voz. La correcta caracterización de la señal de voz y la elección del método adecuado que modele los coeficientes obtenidos en la etapa de extracción de características es esencial para obtener una tasa de reconocimiento significativa. En el presente trabajo, se realizó una comparación de dos técnicas clásicas de parametrización en la etapa de caracterización de la señal de voz; Codificación Predictiva Lineal (LPC) y Coeficientes Cepstrales de Frecuencias Mel (MFCC). Se realizaron diferentes pruebas de estas técnicas con el fin de encontrar la configuración que brinde la mayor tasa de reconocimiento y el menor consumo de recursos (tiempo y cálculo). Se usaron dos frecuencias de muestreo (8 y 16kHz) y se varió el número de coeficientes (8-12 para 8kHz y 16-24 para 16kHz) que caracterizaron a la señal de voz. En la etapa de modelado se hizo uso de la técnica Modelos Ocultos de Markov (HMM). En los resultados se resalta que la técnica de extracción MFCC presentó una tasa de reconocimiento superior que la técnica LPC para la misma frecuencia de muestreo y con el mismo número de coeficientes.
dc.languagespa
dc.publisherUniversidad Autónoma de Zacatecas
dc.relationMaestro en Ciencias de la Ingeniería
dc.relationgeneralPublic
dc.rightshttp://creativecommons.org/licenses/by/3.0/us/
dc.rightsAtribución 3.0 Estados Unidos de América
dc.titleComparación de técnicas de parametrización espectral para reconocimiento de voz en idioma español
dc.typeTesis


Este ítem pertenece a la siguiente institución