Trabajo de grado - Maestría
Caracterización automática de señales de ecolocalización de murciélagos pescadores en Villavicencio - Meta para el análisis y apoyo a la investigación en biodiversidad en la Universidad de los Llanos
Fecha
2022-06-07Registro en:
Universidad Nacional de Colombia
Repositorio Institucional Universidad Nacional de Colombia
Autor
Agudelo Villalobos, Leandro Esneyder
Institución
Resumen
Los murciélagos cuentan con la capacidad de la generación de llamados de ecolocalización para los procesos de desplazamiento y captura del alimento. Estos llamados presentan una serie de características temporales y espectrales que permiten adelantar la identificación de especies, géneros o familias, partiendo de los comportamientos asociados a las variaciones de frecuencias conocidos como tipos de pulsos (frecuencia modulada - FM, frecuencia constante - CF y frecuencia cuasi-constante - QCF) las cuales están enmarcadas en las fases del proceso de forrajeo (búsqueda, aproximación y terminal).
Debido a la dependencia directa de los expertos y la falta de bases de datos anotadas existentes, se adelantó el presente trabajo el cual consiste en la caracterización automática de señales de ecolocalización de murciélagos pescadores por medio de técnicas de procesamiento digital de señales y aprendizaje computacional no supervisado, aplicadas a un conjunto de 4.426 señales anotadas y validadas por biólogos de la Universidad de los Llanos.
A cada audio se le adelantó un preprocesamiento que permitió la extracción e identificación de cada señal de ecolocalización, a la cual se le aplicó un filtro Butterworth pasa banda, previo a la extracción de características espectrales y temporales (Fast Fourier Transform FFT, spectral rolloff, chroma, melspectrogram, Mel Frequency Cepstral Coefficients, spectral centroid, zero crossing rate, entre otras), logrando construir un conjunto de datos de 600 características. Al cual, se le aplicaron los algoritmos Random Forest y Principal Component Analysis para adelantar la reducción de la dimensionalidad; A estos resultados se aplicaron los algoritmos de agrupamiento K-means y Spectral Clustering.
De la evaluación realizada se encontró como factor predominante que para la etiqueta de tipos de pulsos la cantidad de clústeres con mejores resultados es de tres (3), tanto para K-means y Spectral Clustering, con un valor máximo de 0,610 para la métrica de coeficiente de silueta. Mientras que para la etiqueta de fases de forrajeo la cantidad de clústeres con mejores resultados es de dos (2), se encontró una mejora en los resultados al implementar PCA a las características identificadas como relevantes mediante Random Forest antes de implementar el proceso de agrupamiento. (Texto tomado de la fuente) Bats have the ability to generate echolocation calls for the processes of movement and capture of food. These calls present a series of temporal and spectral characteristics that allow to identification of species, genera or families, starting from the behaviors associated with frequency variations known as pulses types (modulated frequency - FM, constant frequency -CF and quasi-constant frequency - QCF), which are in the phases of the foraging process (search, approach and terminal phases).
By the direct dependence of the experts and the lack of existing annotated databases, the present work was carried out, which consists of the automatic characterization of echolocation signals of fishing bats by means of digital signal processing techniques and unsupervised computational learning, applied to a set of 4,426 signals noted and validated by Biologists from the Universidad de los Llanos.
Each audio was preprocessed to extraction and identification of each echolocation signal, to which a Butterworth band-pass filter was applied, prior to the extraction of spectral and temporal characteristics (chroma, melspectrogram, cepstral coefficients of Mel frequency, spectral centroid, zero crossing rate, among others), to build a data set of 600 characteristics. Which the Random Forest and Principal Component Analysis algorithms were applied to advance the reduction of dimensionality; The K-means and Spectral Clustering algorithms were applied to these results.
From the evaluation carried out, it was found as a predominant factor that for the label of pulse types, the number of clusters with the best results is three (3), both for K-means and Spectral Clustering, with a maximum value of 0,610 for the silhouette coefficient metric.; While for the label of foraging phases, the number of clusters with the best results is two (2), an improvement in the results was found when implementing PCA to the characteristics identified as relevant by Random Forest before implementing the clustering process.