TESIS
Identificación de características sonoras en enfermedades neurodegenerativas para detección precoz
Fecha
2020-02-14Registro en:
López Rodríguez, Mario. (2019). Identificación de características sonoras en enfermedades neurodegenerativas para detección precoz. (Maestría en Ciencias en Sistemas Digitales). Instituto Politécnico Nacional, Centro de Investigación y Desarrollo de Tecnología Digital, México.
Autor
López Rodríguez, Mario
Institución
Resumen
RESUMEN: Las organizaciones de la salud de México y la Organización Mundial de la Salud, pronostican que las enfermedades neurodegenerativas, principalmente las enfermedades de Alzheimer y de Parkinson se convertirán en un problema social ya que las instituciones de salud de cada país no están capacitadas para atender las necesidades de los pacientes. Esto se debe principalmente a que las enfermedades neurodegenerativas afectan a las personas mayores de edad, y a los avances en la medicina los cuales han aumentado el tiempo de vida de las personas mayores de edad; por lo que será común registrar en los próximos años, un mayor número de personas con algún tipo de enfermedad neurodegenerativa. La Organización Mundial de la Salud, indica que el principal problema de las personas afectadas por algún tipo de enfermedad neurodegenerativa es que estas se vuelven dependientes y los tratamientos solo frenan el progreso de las enfermedades que suelen ser detectadas ya que los síntomas son evidentes. Además, no existe cura para estas enfermedades. Uno de los síntomas que tienen los seres humanos con alguna enfermedad neurodegenerativa, es que la voz o la fluidez de sus conversaciones se ven afectadas; a partir de este hecho se ha propuesto utilizar este síntoma para la detección o monitoreo de enfermedades neurodegenerativas, como lo son la enfermedad de Alzheimer y la enfermedad de Parkinson. Sin embargo, existen pocas investigaciones que tienen como objetivo realizar una detección precoz. En este trabajo de tesis se proponen, dos modelos para la detección de la enfermedad de Parkinson utilizando como información la voz de las personas. El primer modelo está basado en el uso del método de clasificación de máquinas de soporte vectorial (SVM) y el segundo, utiliza redes neuronales convolucionales (convolutional neuronal networks, CNN). En los dos modelos, se desarrollaron métodos de extracción de características de la señal de voz, los Coeficientes cepstrales de las frecuencias de Mel (Mel-frequency cepstral coefficients, MFCC), la Transformada de la constante Q (constant Q transform, CQT), los Histogramas orientados a gradiente (HOG) y se desarrolló un cuarto método, pero solo se utiliza en el modelo basado en el clasificador SVM, este se basa en las características sobre las métricas de la afonía. Después de realizar los experimentos se determina que el modelo basado en el clasificador de red CNN es el más preciso de los modelos desarrollados en este trabajo de tesis para la detección de la enfermedad de Parkinson y el método de extracción de características MFCC es el método que brinda más información para la clasificación en el modelo de red CNN.
ABSTRACT: The health organizations of Mexico and the World Health Organization predict that neurodegenerative diseases, mainly Alzheimer´s and Parkinson´s diseases, will become a social problem since the health institutions of each country are not prepared to attend patient needs. This is mainly due to the fact that neurodegenerative diseases affect the elderly, and the advances in medicine have increased the life span of the elderly; so it will be common to register in the coming years, a greater number of people with some type of neurodegenerative disease. The World Health Organization indicates that the main problem of people affected by some type of neurodegenerative disease is that they become dependent and the treatments only slow the progress of the diseases that are usually detected when symptoms are evident. In addition, there is no cure for these diseases. One of the symptoms that humans have with some neurodegenerative disease is that the voice or fluidity of their conversations are affected; Based on this fact, it has been proposed to use this symptom for the detection or monitoring of neurodegenerative diseases, such as Alcheimer´s disease and Parkinson´s disease. However, there is little research that aims to make early detection. In this thesis work, two models for the detection of Parkinson´s disease are proposed using the voice of people as information. The first model is based on the use of the vector support machine classification (SVM) method and the second model uses convolutional neural networks (CNN). In both models, methods for extracting characteristics of the voice signal were developed, the Cepstral coefficients of the Mel frequencies (Mel-frequency cepstral coefficients, MFCC), the Transform of the constant Q (constant Q transform, CQT), the Gradient Oriented Histograms (HOG) and a fourth method was developed, but it is only used in the model based on the SVM classifier, this method is based on the characteristics of the aphonia metrics. After performing the experiments, it is determined that the model based on the CNN network classifier is the most accurate of the models developed in this thesis work for the detection of Parkinson´s disease and the MFCC feature extraction method is the method that provides more information for classification in the CNN network model.