Trabajo de grado - Maestría
Supported diagnosis of adhd from eeg signals based on hidden markov models and probability product kernels
Registro en:
Universidad Tecnológica de Pereira
Repositorio institucional Universidad Tecnológica de Pereira
Autor
Maya Piedrahita, María Camila
Institución
Resumen
Attention deficit hyperactivity disorder (ADHD), most often present in childhood, may persist in adult life, hampering personal development. However, ADHD diagnosis is a real challenge since it highly depends on the clinical observation of the patient, the parental and scholar information, and the specialist expertise. Despite demanded objective diagnosis aids from biosignals, the physiological biomarkers lack robustness
and significance under the non-stationary and non-linear electroencephalographic dynamics. Therefore, this work presents a supported diagnosis methodology for ADHD from the dynamic characterization of EEG based on hidden Markov models (HMM) and probability product kernels (PPK). Based on the symptom of impulsivity, the proposed approach trains an HMM for each subject from EEG signals in failed inhibition tasks. In the first instance, PPK measures the similarity between subjects through the inner
product between their trained HMMs. Then, given the computational costs, fast computation of PPK for HMM facilitates parameter tuning of kernel similarity. Finally, the Kernel Principal Component Analysis (KPCA) projects the PPK to a lower dimensional space, allowing the interpretability of the results. Thus, a support vector machine supports the diagnosis of ADHD as a classification task using PPK as the inner product operator. The methodology compared classification results on EEG signals with all channels, channels of interest (COI), and analysis in the Theta, Alpha, and Beta frequency bands. The results show an accuracy rate of 97.0% in the Beta band in COI, which supports the assumption that this frequency rhythm may be correlated to differences between ADHD and controls regarding attentional allocation during the execution of the cognitive task. El trastorno por déficit de atención e hiperactividad (TDAH), que suele presentarse en la infancia, puede persistir en la vida adulta, obstaculizando el desarrollo personal. Sin embargo, el diagnóstico del TDAH es un verdadero reto, ya que depende en gran medida de la observación clínica del paciente, de la información de los padres y de los estudiosos, y de la experiencia de los especialistas. A pesar de la demanda de ayudas para el diagnóstico objetivo a partir de bioseñales, los biomarcadores fisiológicos carecen de robustez y significación bajo la dinámica electroencefalográfica no estacionaria y no lineal. Por lo tanto, este trabajo presenta una metodología de diagnóstico apoyada para el TDAH a partir de la caracterización dinámica del EEG basada en modelos ocultos de Markov (HMM) y productos de kernel de probabilidad
(PPK). Basándose en el síntoma de impulsividad, el enfoque propuesto entrena un HMM para cada sujeto a partir de las señales del EEG en tareas de inhibición fallidas. En primer lugar, el PPK mide la similitud entre los sujetos a través del producto interno entre sus HMMs entrenados. Luego, dados los costes computacionales, el cálculo rápido de PPK para los HMM facilita el ajuste de los parámetros de similitud del kernel. Por último, el Análisis de Componentes Principales del Kernel (KPCA) proyecta el PPK a
un espacio de menor dimensión, lo que permite la interpretabilidad de los resultados. Así, una máquina de vectores de apoyo apoya el diagnóstico del TDAH como una tarea de clasificación utilizando el PPK como operador de producto interno. La metodología comparó los resultados de clasificación en señales de EEG con todos los canales, canales de interés (COI), y análisis en las bandas de frecuencia Theta, Alpha, y Beta. Los resultados muestran una tasa de precisión del 97,0% en la banda Beta en COI, lo que apoya la suposición de que este ritmo de frecuencia puede estar correlacionado con las diferencias entre el TDAH y los controles en cuanto a la asignación atencional durante la ejecución de la tarea cognitiva. Maestría Magíster en Ingeniería Eléctrica Contents
1 List of Symbols and Abbreviations 5
1.1 Symbols . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Abbrevations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2 Introduction 7
2.1 Problem statement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Justification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3 State of the art . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.4 Objectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.4.1 General objective . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.4.2 Specific objectives . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3 Develop a multichannel time series classification methodology taking into account signal dynamics 13
3.1 Methods . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.1.1 Similarity between time series . . . . . . . . . . . . . . . . . . . . . . 13
3.2 Experimental Setup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2.1 EEG Dataset . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2.2 HMM training . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.2.3 Parameter tuning and Classification . . . . . . . . . . . . . . . . . . . 17
3.3 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.4 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4 Develop a time series classification methodology that takes into account spectral information and reduces the computational cost of training. 21
4.1 Methods . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.1.1 Fast computation of PPK for HMM . . . . . . . . . . . . . . . . . . . 22
4.2 Experimental Setup . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2.1 Synthetic Database . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2.2 Training and Parameter tuning and classification . . . . . . . . . . . 24
4.3 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1
CONTENTS
4.4 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5 Develop a methodology for visualizing stochastic representations to facilitate
the interpretability of inference machines 32
5.1 Methods . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.1.1 Model interpretability . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.1.2 Low-dimensional HMM visualization . . . . . . . . . . . . . . . . . . 33
5.1.3 Low-dimensional state visualization . . . . . . . . . . . . . . . . . . 34
5.2 Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.3 Discussion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
6 Conclusions 40