Tesis
Caracterización Automática del Llanto de Bebé para su Estudio con Modelos de Clasificación
Autor
ERIKA AMARO CAMARGO
Institución
Resumen
As a part of a project that seeks to support early detection of pathologies in newborn
babies, this thesis proposes a system of Automatic Infant Cry Recognition based on a
characterization defined by the combination of acoustical features, which are obtained
by different extraction techniques. Experiments were performed to recognize three
types of cry: normal, pathological cry of hypo-acoustic (deaf) infants and asphyxia.
The fact that the parameters have been derived from different spectral representation
of the signal, suggests the possibility of raising different combinations of features to
provide benefits to improve the representation of each type of crying, and
consequently, increase the final recognition rate. In general, four characteristics
extraction techniques were used: LPC (Linear Predictive Coding), MFCC (Mel
Frequency Cepstral Coefficients), Intensity and Cochleograms. The original
characteristic vectors were reduced through two methods like: LDA (Linear
Discriminant Analysis), and a proposed method which is called, "Reduction by
Statistics Operations". The combination of characteristics was carried out using the
reduced characteristic vectors. The use of cochleograms to classify infant cry is one
of the contributions of this thesis work. According to experiments, it was observed
that cochleograms equalized, and in some cases improved the results obtained by
techniques such as LPC or MFCC, which are widely used in speech recognition for
their good results. Several tests were performed to validate the characterization. By
applying traditional techniques such as ten-fold-cross-validation, results of an
accuracy of 98.66% were achieved with vectors formed by the combination of four
types of features. Other tests, which we call “individual tests” achieved results of
100% for the classification of the deaf class. Finally we defined a knowledge base for
the classification of baby's cry considering the results and observations derived from
this research. Como parte de un proyecto que busca apoyar la detección temprana de patologías en
bebés recién nacidos, este trabajo de tesis propone un sistema de reconocimiento
automático del llanto de bebés basado en una caracterización definida por la
combinación de características, las cuales, son obtenidas por diferentes técnicas de
extracción. Los experimentos se realizaron para reconocer tres tipos de llanto: normal
(normo-oyente), patológico de bebés con hipoacusia (sordera) y asfixia. El hecho de
que los parámetros hayan sido derivados de distintas representaciones de la señal,
sugiere la posibilidad de plantear distintas combinaciones de características que
aporten ventajas para mejorar la representación de cada tipo de llanto, y en
consecuencia, aumentar la tasa de reconocimiento final. En general, se utilizaron
cuatro técnicas de extracción de características: LPC (Codificación Predictiva
Lineal), MFCC (Coeficientes Cepstrales de Frecuencia Mel), Intensidad y
Cocleograma. Los vectores característicos originales fueron reducidos a través de dos
métodos que son: LDA (Análisis Discriminante Lineal) y un método que se propone,
el cual se denominó, “Reducción por Operaciones Estadísticas”. La combinación de
características se llevó a cabo utilizando los vectores característicos reducidos. El uso
de cocleogramas para llevar a cabo el reconocimiento automático del llanto de bebés
es una de las aportaciones de este trabajo de tesis. De acuerdo a los experimentos
realizados, se observó que los cocleogramas igualaron y en algunos casos mejoraron
los resultados obtenidos por técnicas como LPC o MFCC, las cuales, son
ampliamente utilizadas en reconocimiento de habla y han dado buenos resultados en
reconocimiento de llanto. Diversas pruebas fueron realizadas para validar la
caracterización. Aplicando técnicas tradicionales como validación cruzada, se
lograron resultados del 98.66% de precisión con vectores formados por la
combinación de cuatro tipos de características. Otro tipo de pruebas, las cuales
denominamos pruebas por individuo arrojaron resultados de clasificación del 100%
para la clase sordos. Finalmente, se define una base de conocimiento para la
clasificación del llanto de bebé considerando los resultados y las aportaciones
derivadas de este trabajo de investigación.
Materias
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Compendio de innovaciones socioambientales en la frontera sur de México
Adriana Quiroga -
Caminar el cafetal: perspectivas socioambientales del café y su gente
Eduardo Bello Baltazar; Lorena Soto_Pinto; Graciela Huerta_Palacios; Jaime Gomez -
Material de empaque para biofiltración con base en poliuretano modificado con almidón, metodos para la manufactura del mismo y sistema de biofiltración
OLGA BRIGIDA GUTIERREZ ACOSTA; VLADIMIR ALONSO ESCOBAR BARRIOS; SONIA LORENA ARRIAGA GARCIA