Procesamiento de señales EEG para el reconocimiento de voz imaginada
Fecha
2018-11-15Registro en:
Guadarrama Rendón, Yazaed Zaid. (2017). Procesamiento de señales EEG para el reconocimiento de voz imaginada (Maestría en Ciencias en Ingeniería de Cómputo). Instituto Politécnico Nacional, Centro de Investigación en Computación, México.
Autor
Guadarrama Rendón, Yazaed Zaid
Institución
Resumen
RESUMEN:
El cerebro humano es el órgano de mayor complejidad conocido por la humanidad, por tanto, numerosas investigaciones se centran o relacionan con él. El estudio del cerebro ha sido potenciado por un cúmulo de tecnologías y técnicas en continua evolución y desarrollo. La electroencefalografía (EEG) es una de estas tecnologías, es una exploración neurofisiológica que se basa en el registro de la actividad bioeléctrica cerebral cuyo fin inicial tuvo miras en el campo de la medicina. Hoy en día la electroencefalografía ha superado sus orígenes y significativos esfuerzos se encaminan para llevar los registros de la actividad bioeléctrica cerebral a aplicaciones motoras, de reconocimiento de emociones; entre otras. Siendo de especial relevancia para el trabajo propuesto los relacionados a los neuroparadigmas del habla como medio de comunicación común entre personas.
En este trabajo se propone y estudia la normalización selectiva, metodología que tiene como fin la mejora en la caracterización de los patrones para elevar la precisión en el reconocimiento y reducir el tiempo de convergencia. La metodología propuesta fue validada con registros de señales electroencefalográficas de habla imaginada correspondientes a 14 clases fonológicas grabadas por 11 sujetos. Los patrones tratados con normalización selectiva fueron reconocidos con una mejora en la precisión del 12% por el modelo GMM-HMM, para un total de 96%, mientras que el tiempo de convergencia fue reducido en más del 70%.
Se realizaron investigaciones adicionales centradas en la identificación de la influencia de los parámetros estadísticos que forman los patrones característicos. Para un primer caso, el modelo GMM-HMM fue alimentado con subconjuntos de características de entre el 38% y 67% de la longitud del vector original, se obtuvo una precisión del 93%, mientras que para una selección común para todos los usuarios se alcanzó el 90%. Para un segundo caso, se identificaron 6 modelos de clasificación en el estado del arte con mayor precisión en la clasificación usando patrones con normalización selectiva. El resultado se comparó contra los resultados obtenidos con un patrón menor al 10% de la longitud original del mismo mejorando en un 33% la precisión en la clasificación.
ABSTRACT:
The human brain is the most complex organ known to mankind, therefore, many research efforts are focused or related to it. The study of the brain has been advanced by a cluster of technologies and techniques in continuous evolution and development. Electroencephalography (EEG) is one of those technologies, it is a neurophysiological exploration that is based on the recording of bioelectric brain activity which initial aim was for medicine. Nowadays electroencephalography has overcome its origins and significant efforts are being made to bring the records of brain bioelectric activity to motor systems applications, emotion classification; among many others. Being of particular relevance for this work are the uses oriented to speech-related neuro paradigms as a way for day-to-day communication between people.
In this work, selective normalization is proposed and studied, a methodology aiming to increase the recognition accuracy of the pattern characterization process and the convergence time improvement of the classification process. The methodology was validated using electroencephalographic signal registers of imagined speech, corresponding to 14 phonological classes recorded by 11 subjects. The patterns treated with selective normalization were recognized with an improvement in the accuracy of 12% by the GMM-HMM model, for a total of 96%, while it's convergence time was reduced by more than 70%.
Additional research focused on the impact identification of the statistical parameters, shaping the characteristic patterns. For a first case, for the GMM-HMM model, we obtained 93% recognition accuracy by using feature subsets between 38% and 67% of the original vector length, while using a common selection for all users we reached a 90%. For a second case, we found 6 classification relevance models in the state of the art with better classification precision was identified, using patterns with selective normalization. The result was compared against the reported results with a pattern of less than 10% of the original length, improving the classification accuracy by 33%.