Tesis
Supervised classifiers based on emerging patterns for class imbalance problems
Autor
OCTAVIO LOYOLA GONZALEZ
Institución
Resumen
In the last years, emerging pattern-based classifiers have become an important family of supervised classifiers. However, in those problems where the objects are not equally distributed into the classes (class imbalance problems), emerging pattern mining algorithms, not designed for this kind of problems, extract several emerging patterns with high support for the majority class and only a few (or none) emerging patterns with low support for the minority class. As a consequence, emerging pattern-based classifiers tend to bias their classification results toward the majority class; obtaining poor classification results for the minority class. Hence, in this PhD research, we first present a study about the effect of class imbalance on quality measures for patterns; from this study, we select the best measure for ranking emerging patterns in class imbalance problems. Additionally, we propose three new algorithms for extracting emerging patterns from imbalanced databases. Our emerging pattern mining algorithms extract a collection of emerging patterns which allows attaining higher accuracies for supervised classification in class imbalance problems than those emerging patterns extracted by other emerging pattern miners developed for this kind of problems. Finally, we propose a new emerging pattern-based classifier specifically designed for class imbalance problems, which obtains significantly better classification results than other classifiers for class imbalance problems reported in the literature. Los clasificadores basados en patrones emergentes son una familia importante de clasificadores dentro de la clasificación supervisada. Sin embargo, en aquellos problemas dónde los objetos no están distribuidos equitativamente entre las clases (problemas con desbalance de clases), los algoritmos para la extracción de patrones emergentes, que no toman en cuenta este tipo de problemas, extraen muchos patrones emergentes con alto soporte para la clase mayoritaria y sólo unos pocos (a veces ninguno) patrones emergentes con bajo soporte para la clase minoritaria. Como consecuencia, los clasificadores basados en patrones emergentes tienden a sesgar sus resultados de clasificación hacia la clase mayoritaria; obteniendo así, bajos resultados de clasificación para la clase minoritaria. Por ello, en esta investigación doctoral, primero presentamos un estudio acerca del efecto del desbalance de clases en las medidas de calidad para patrones. Adicionalmente, propusimos tres nuevos algoritmos para extraer patrones emergentes en bases de datos con desbalance de clases. Estos algoritmos extraen una colección de patrones emergentes que permiten obtener mayor eficacia, en problemas con desbalance de clases, que la que puede obtenerse al utilizar la colección de patrones emergentes extraídos mediante otros extractores de patrones emergentes reportados en la literatura. Finalmente, propusimos un nuevo clasificador basado en patrones emergentes, específicamente diseñado para problemas con desbalance de clases, que obtiene significativamente mejores resultados de clasificación que aquellos clasificadores reportados en la literatura para problemas con desbalance de clases.
Materias
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Compendio de innovaciones socioambientales en la frontera sur de México
Adriana Quiroga -
Caminar el cafetal: perspectivas socioambientales del café y su gente
Eduardo Bello Baltazar; Lorena Soto_Pinto; Graciela Huerta_Palacios; Jaime Gomez -
Material de empaque para biofiltración con base en poliuretano modificado con almidón, metodos para la manufactura del mismo y sistema de biofiltración
OLGA BRIGIDA GUTIERREZ ACOSTA; VLADIMIR ALONSO ESCOBAR BARRIOS; SONIA LORENA ARRIAGA GARCIA