Article
Impacto de los algoritmos de sobremuestreo en la clasificación de subtipos principales del síndrome de Guillain-Barré
Fecha
2021-01Autor
Torres-Vásquez, Manuel
Hernández-Torruco, José
Hernández-Ocaña, Betania
Chávez-Bosquez, Oscar
Institución
Resumen
El síndrome de Guillain-Barré es un trastorno neurológico
donde el sistema inmune del cuerpo ataca
al sistema nervioso periférico. Esta enfermedad es
de rápida evolución y es la causa más frecuente de
parálisis del cuerpo. Existen cuatro variantes de SGB:
polineuropatía desmielinizante inflamatoria aguda,
neuropatía axonal motora aguda, neuropatía axonal
sensorial aguda y síndrome de Miller-Fisher. Identificar
el subtipo de SGB que el paciente contrajo es
determinante debido a que el tratamiento es diferente
para cada subtipo. El objetivo de este estudio fue
determinar cuál algoritmo de sobremuestreo mejora
el rendimiento de los clasificadores. Además, determinar
si balancear los datos mejoran el rendimiento de
los modelos predictivos. Aplicamos tres métodos de
sobremuestro (ROS, SMOTE y ADASYN) a la clase
minoritaria, utilizamos tres clasificadores (C4.5, SVM
y JRip). El rendimiento de los modelos se obtuvo mediante
la curva ROC. Los resultados muestran que
balancear el dataset mejora el rendimiento de los modelos
predictivos. El algoritmo SMOTE fue el mejor
método de balanceo en combinación con el clasificador
JRip para OVO y el clasificador C4.5 para OVA.//Guillain-Barré Syndrome (GBS) is a neurological disorder
where the body’s immune system attacks the peripheral
nervous system. This disease evolves rapidly
and is the most frequent cause of paralysis of the
body. There are four variants of GBS: Acute Inflammatory
Demyelinating Polyneuropathy, Acute Motor
Axonal Neuropathy, Acute Sensory Axial Neuropathy,
and Miller-Fisher Syndrome. Identifying the GBS
subtype that the patient has is decisive because the
treatment is different for each subtype. The objective
of this study was to determine which oversampling algorithm
improves classifier performance. In addition,
to determine whether balancing the data improves
the performance of the predictive models. Three oversampling
methods (ROS, SMOTE, and ADASYN)
were applied to the minority class. Three classifiers
(C4.5, SVM and JRip) were used. The performance
of the models was obtained using the ROC curve.
Results show that balancing the dataset improves the
performance of the predictive models. The SMOTE
Algorithm was the best balancing method, in combination
with the classifier JRip for OVO and the
classifier C4.5 for OVA.