info:eu-repo/semantics/article
EEG Signal Clustering With Learned Features Using Deep Autoencoder
Agrupamiento de Señales EEG con Rasgos Aprendidos Usando Autoencoder Profundo
Registro en:
10.54139/revinguc.v28i1.18
Autor
Villazana , Sergio
Seijas , César
Montilla , Guillermo
Pérez , Egilda
Institución
Resumen
This work proposes a convolutional autoencoder based non-supervised feature extractor, to find clusters of electroencephalographic signal (EEG) to supporting to the physicists to diagnose the epilepsy condition. Three autoencoders were designed with input dimensions of 4096×1, 2048×2 and 768×6, to analyze the impact of the signal length on latent representation generated by autoencoders. Latent representation was used as input to the clustering algorithms K-means and support vector clustering. Latent representation was mapped onto a two-dimensional space of mean and standard deviation to visualize it, and to apply the clustering algorithms. Results showed a good latent representation of the three autoencoders, with a maximum reconstruction error of 1,47 % for the worst case. Clustering algorithms got visually consistent clusters compared with the ground-truth distribution onto the two-dimension latent space. The best performance was achieved with the K-means algorithm and the best latent representation of the input signal. Resultant clusters were impacted by the length of the input segment, where K-means with an input length of 4096 samples had the best performance.
Este trabajo propone un algoritmo basado en autoencoders convolucionales como extractor de rasgos no supervisado, para hallar grupos o clusters de señales electroencefalográficas (EEG), como apoyo para el especialista médico para facilitar el diagnóstico de la condición de epilepsia. Se diseñaron tres autoencoders con señales de entrada de 4096×1, 2048×2 y 768×6, para analizar el efecto de la longitud de la señal sobre la representación latente generada por los autoencoders. Las representación latente se utilizó como entrada a los algoritmos de agrupamiento K-means y basado en vectores de soporte. La representación latente se llevó a un espacio bidimensional donde se obtuvo la media y la desviación estándar para visualizarla, y operar sobre ellas los algoritmos de agrupamiento. Los resultados demostraron una buena representación latente de los tres autoencoders, con un error máximo de reconstrucción de las señales de entrada de 1,47 % para el peor caso. Los algoritmos de agrupamiento lograron obtener unos grupos visualmente consistentes con la distribución de los puntos de referencia en el espacio bidimensional latente. La mejor medida de desempeño se logró con el algoritmo K-means con la mejor representación latente de las señales de entrada. Los grupos resultantes fueron influenciados por la longitud del segmento de entrada, donde el algoritmo K-means con una longitud de entrada de 4096 muestras tuvo la mejor medida de desempeño.