Clasificadores Rápidos basados en el algoritmo del Vecino más Similar (MSN) para Datos Mezclados

dc.contributoren-US
dc.contributores-ES
dc.creatorHernández Rodríguez, Selene
dc.creatorMartínez Trinidad, José Francisco
dc.creatorCarrasco Ochoa, Jesús Ariel
dc.date2011-06-29
dc.date.accessioned2018-03-16T14:24:52Z
dc.date.available2018-03-16T14:24:52Z
dc.identifierhttp://ojs.unam.mx/index.php/cys/article/view/26064
dc.identifier.urihttp://repositorioslatinoamericanos.uchile.cl/handle/2250/1190713
dc.descriptionThe k nearest neighbor (k-NN) classifier has been extensively used in Pattern Recognition because of its simplicity and its good performance. However, in large datasets applications, the exhaustive k-NN classifier becomes impractical. Therefore, many fast k-NN classifiers have been developed; most of the rely on metric properties (usually the triangle inequality) to reduce the number of prototype comparisons. Hence, the existing fast k-NN classifiers are applicable only when the comparison function is a metric (commonly for numerical data). However, in some sciences such as Medicine, Geology, Sociology, etc., the prototypes are usually described by qualitative and quantitative features (mixed data). In these cases, the comparison function does not necessarily satisfy metric properties. For this reason, it is important to develop fast k most similar neighbor (k-MSN) classifiers for mixed data, which use non metric comparisons functions. In this thesis, four fast k-MSN classifiers, following the most successful approaches, are proposed. The experiments over different datasets show that the proposed classifiers significantly reduce the number of prototype comparisons.en-US
dc.descriptionEl clasificador k vecinos más cercanos (k-NN) ha sido ampliamente utilizado dentro del Reconocimiento de Patrones debido a su simplicidad y buen funcionamiento. Sin embargo, en aplicaciones en las cuales el conjunto de entrenamiento es muy grande, la comparación exhaustiva que realiza k-NN se vuelve inaplicable. Por esta razón, se han desarrollado diversos clasificadores rápidos k-NN; la mayoría de los cuales se basan en propiedades métricas (en particular la desigualdad triangular) para reducir el número de comparaciones entre prototipos. Por lo cual, los clasificadores rápidos k-NN existentes son aplicables solamente cuando la función de comparación es una métrica (usualmente con datos numéricos). Sin embargo, en algunas ciencias como la Medicina, Geociencias, Sociología, etc., los prototipos generalmente están descritos por atributos numéricos y no numéricos (datos mezclados). En estos casos, la función de comparación no siempre cumple propiedades métricas. Por esta razón, es importante desarrollar clasificadores rápidos basados en la búsqueda de los k vecinos más similares (k-MSN) para datos mezclados que usen funciones de comparación no métricas. En esta tesis, se proponen cuatro clasificadores rápidos k-MSN, siguiendo los enfoques más exitosos. Los experimentos con diferentes bases de datos muestran que los clasificadores propuestos reducen significativamente el número de comparaciones entre prototipos.es-ES
dc.formatapplication/pdf
dc.languagespa
dc.publisherComputación y Sistemases-ES
dc.relationhttp://ojs.unam.mx/index.php/cys/article/view/26064/24533
dc.sourceComputación y Sistemas; Vol 14, No 001 (2010)es-ES
dc.source1405-5546
dc.subjectNearest neighbor rule; fast nearest neighbor search; mixed data; non-metric comparison functionsen-US
dc.subjectRegla del vecino más cercano; búsqueda rápida del vecino más cercano; datos mezclados; funciones de comparación no métricases-ES
dc.titleFast Most Similar Neighbor (MSN) classifiers for Mixed Dataen-US
dc.titleClasificadores Rápidos basados en el algoritmo del Vecino más Similar (MSN) para Datos Mezcladoses-ES
dc.typeArtículos de revistas
dc.typeArtículos de revistas


Este ítem pertenece a la siguiente institución