Fast Most Similar Neighbor (MSN) classifiers for Mixed Data

Hernández Rodríguez, Selene; Martínez Trinidad, José Francisco; Carrasco Ochoa, Jesús Ariel

Clasificadores Rápidos basados en el algoritmo del Vecino más Similar (MSN) para Datos Mezclados

dc.contributor		en-US
dc.contributor		es-ES
dc.creator	Hernández Rodríguez, Selene
dc.creator	Martínez Trinidad, José Francisco
dc.creator	Carrasco Ochoa, Jesús Ariel
dc.date	2011-06-29
dc.date.accessioned	2018-03-16T14:24:52Z
dc.date.available	2018-03-16T14:24:52Z
dc.identifier	http://ojs.unam.mx/index.php/cys/article/view/26064
dc.identifier.uri	http://repositorioslatinoamericanos.uchile.cl/handle/2250/1190713
dc.description	The k nearest neighbor (k-NN) classifier has been extensively used in Pattern Recognition because of its simplicity and its good performance. However, in large datasets applications, the exhaustive k-NN classifier becomes impractical. Therefore, many fast k-NN classifiers have been developed; most of the rely on metric properties (usually the triangle inequality) to reduce the number of prototype comparisons. Hence, the existing fast k-NN classifiers are applicable only when the comparison function is a metric (commonly for numerical data). However, in some sciences such as Medicine, Geology, Sociology, etc., the prototypes are usually described by qualitative and quantitative features (mixed data). In these cases, the comparison function does not necessarily satisfy metric properties. For this reason, it is important to develop fast k most similar neighbor (k-MSN) classifiers for mixed data, which use non metric comparisons functions. In this thesis, four fast k-MSN classifiers, following the most successful approaches, are proposed. The experiments over different datasets show that the proposed classifiers significantly reduce the number of prototype comparisons.	en-US
dc.description	El clasificador k vecinos más cercanos (k-NN) ha sido ampliamente utilizado dentro del Reconocimiento de Patrones debido a su simplicidad y buen funcionamiento. Sin embargo, en aplicaciones en las cuales el conjunto de entrenamiento es muy grande, la comparación exhaustiva que realiza k-NN se vuelve inaplicable. Por esta razón, se han desarrollado diversos clasificadores rápidos k-NN; la mayoría de los cuales se basan en propiedades métricas (en particular la desigualdad triangular) para reducir el número de comparaciones entre prototipos. Por lo cual, los clasificadores rápidos k-NN existentes son aplicables solamente cuando la función de comparación es una métrica (usualmente con datos numéricos). Sin embargo, en algunas ciencias como la Medicina, Geociencias, Sociología, etc., los prototipos generalmente están descritos por atributos numéricos y no numéricos (datos mezclados). En estos casos, la función de comparación no siempre cumple propiedades métricas. Por esta razón, es importante desarrollar clasificadores rápidos basados en la búsqueda de los k vecinos más similares (k-MSN) para datos mezclados que usen funciones de comparación no métricas. En esta tesis, se proponen cuatro clasificadores rápidos k-MSN, siguiendo los enfoques más exitosos. Los experimentos con diferentes bases de datos muestran que los clasificadores propuestos reducen significativamente el número de comparaciones entre prototipos.	es-ES
dc.format	application/pdf
dc.language	spa
dc.publisher	Computación y Sistemas	es-ES
dc.relation	http://ojs.unam.mx/index.php/cys/article/view/26064/24533
dc.source	Computación y Sistemas; Vol 14, No 001 (2010)	es-ES
dc.source	1405-5546
dc.subject	Nearest neighbor rule; fast nearest neighbor search; mixed data; non-metric comparison functions	en-US
dc.subject	Regla del vecino más cercano; búsqueda rápida del vecino más cercano; datos mezclados; funciones de comparación no métricas	es-ES
dc.title	Fast Most Similar Neighbor (MSN) classifiers for Mixed Data	en-US
dc.title	Clasificadores Rápidos basados en el algoritmo del Vecino más Similar (MSN) para Datos Mezclados	es-ES
dc.type	Artículos de revistas
dc.type	Artículos de revistas

Este ítem pertenece a la siguiente institución

Universidad Nacional Autónoma de México