Tesis
Correlación solo de fase limitada en banda y uso de coeficientes cepstrales inversos: aplicación en reconocimiento de voz y bioacústica
Fecha
2019-09-01Autor
Pedroza Ramírez, Ángel David
Institución
Resumen
El procesamiento digital de señales consiste en la aplicación de distintas operaciones matemáticas a una cierta información bajo análisis. Debido a su estrecha relación con otras ciencias,
el procesamiento de señales conforma la base de otras áreas de investigación como el reconocimiento automático de voz y la bioacústica. El procesamiento de señales en este contexto conforma una herramienta de solución para diversas problemáticas. Una de las que más
relevancia tiene es el denominado: Cambio climático. En este contexto, las aves juegan un rol
fundamental y por tanto la conservación e identificación de las especies de aves es de suma importancia. A pesar de que el reconocimiento de voz provee de soluciones para sistemas concretos en bioacústica, algunas de las técnicas utilizadas fallan en la capacidad de reconocimiento
en ambientes naturales.Tomando en cuenta lo anterior, dado que el procesamiento de señales es
una herramienta de solución en diversos contextos y tomando en cuenta que algunas especies
de aves poseen patrones acústicos, entonces es posible el desarrollo de una nueva metodología
en reconocimiento de voz que luego puede ser extrapolada como parte del diseño de un nuevo
sistema de reconocimiento automático para la identificación de aves (para algunas especies
específicas) e individuos, con una eficiencia de reconocimiento por encima del 70%. En la
primera fase de investigación fue propuesto una adaptación de la función BLPOC (correlación
solo de fase limitada en banda) para la verificación automática de hablantes con datos limitados. Luego de las pruebas, la función BLPOC mostró ser también un método efectivo para un
sistema de verificación de hablantes bajo la condición de datos limitados. Tomando como base
estos resultados, en la segunda fase se propuso una nueva técnica para la identificación individual de aves mediante la función BLPOC. De las pruebas de desempeño se puede concluir que
este es un método eficiente para la identificación de individuos de especies. En esta segunda
fase se propuso un método adicional de clasificación automática de especies de aves basado
en la extracción de las características IMFCC (coeficientes cepstrales inversos en la frecuencia mel ) de las vocalizaciones. De los resultados obtenidos se concluye que la información
acústica de las vocalizaciones de aves en las altas frecuencias (capturadas por los IMFCC’s)
es tan significativa como la información acústica en las bajas frecuencias (capturadas por los
MFCC´s) para la clasificación de aves a través de vocalizaciones.