info:eu-repo/semantics/doctoralThesis
Desarrollo de clasificadores basados en reglas de asociación de clase
Autor
RAUDEL HERNANDEZ LEON
Resumen
Classification based on Class Association Rules (CARs) or associative classification
is a data mining technique that consists of, given a training instance set, finding certain
characteristics in the instances in order to build rules that are subsequently used for
classifying unseen instances. Associative classification has been used in different tasks,
for example: text classification, text segmentation, and automatic image annotation,
among others. However, associative classification methods still have some weaknesses.
In this doctoral dissertation we propose an algorithm called CAR-CA, which introduces
a new pruning strategy that allows to obtain specific rules with high values of
the quality measure. Besides, we introduce two classifiers based on CARs, CAR-IC and
CAR-NF, both use a new way for ordering the set of CARs based on the rule size, a
new covering criterion that considers the inexact coverage when any rule covers the new
instance, and a new strategy for deciding the class of a new instance. Additionally, these
classifiers use as threshold for the quality measure, the minimum value that avoids ambiguity
at the classification stage. In particular, The CAR-NF classifier introduces the
use of the Netconf measure to compute the set of CARs. The experimental results show
that the proposed CARs based classifiers CAR-IC and CAR-NF have better performance
than the main successful classifiers based on CARs. La clasificación basada en Reglas de Asociación de Clase (CARs) es una técnica de la
Minería de Datos que consiste en dado un conjunto de instancias de entrenamiento, identificar
ciertas características en las instancias para construir reglas que posteriormente
se utilicen en la clasificación de nuevas instancias. La clasificación basada en CARs se
ha utilizado en diferentes tareas como: la clasificación y segmentación de textos, el etiquetado
automático de imágenes, entre otras. No obstante, los principales clasificadores
desarrollados, basados en CARs, presentan varias limitaciones.
En el marco de esta tesis doctoral se introduce un algoritmo para calcular el conjunto
de reglas, CAR-CA, el cual introduce una nueva estrategia de poda que permite obtener
reglas específicas, en lugar de reglas generales, con altos valores de la medida de calidad.
Además, se introducen dos clasificadores basados en CARs, CAR-IC y CAR-NF, que
utilizan una nueva estrategia de ordenamiento basada en el tamaño de las reglas, un
nuevo criterio de cubrimiento que considera el cubrimiento inexacto en ausencia de reglas
que cubran completamente a la nueva instancia, y un nuevo criterio de decisión para
asignar una clase a la nueva instancia. Adicionalmente, ambos clasificadores utilizan
como umbral de la medida de calidad, el mínimo valor que evita la ambigüedad al
momento de clasificar. En el caso específico del clasificador CAR-NF se introduce el uso
de la medida de calidad Netconf para calcular las reglas. Los experimentos realizados
muestran que los clasificadores propuestos son superiores en calidad a los clasificadores
más exitosos basados en CARs.
Materias
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Compendio de innovaciones socioambientales en la frontera sur de México
Adriana Quiroga -
Caminar el cafetal: perspectivas socioambientales del café y su gente
Eduardo Bello Baltazar; Lorena Soto_Pinto; Graciela Huerta_Palacios; Jaime Gomez -
Material de empaque para biofiltración con base en poliuretano modificado con almidón, metodos para la manufactura del mismo y sistema de biofiltración
OLGA BRIGIDA GUTIERREZ ACOSTA; VLADIMIR ALONSO ESCOBAR BARRIOS; SONIA LORENA ARRIAGA GARCIA