Fast Most Similar Neighbor (MSN) classifiers for Mixed Data
Clasificadores Rápidos basados en el algoritmo del Vecino más Similar (MSN) para Datos Mezclados
dc.contributor | en-US | |
dc.contributor | es-ES | |
dc.creator | Hernández Rodríguez, Selene | |
dc.creator | Martínez Trinidad, José Francisco | |
dc.creator | Carrasco Ochoa, Jesús Ariel | |
dc.date | 2011-06-29 | |
dc.date.accessioned | 2018-03-16T14:24:52Z | |
dc.date.available | 2018-03-16T14:24:52Z | |
dc.identifier | http://ojs.unam.mx/index.php/cys/article/view/26064 | |
dc.identifier.uri | http://repositorioslatinoamericanos.uchile.cl/handle/2250/1190713 | |
dc.description | The k nearest neighbor (k-NN) classifier has been extensively used in Pattern Recognition because of its simplicity and its good performance. However, in large datasets applications, the exhaustive k-NN classifier becomes impractical. Therefore, many fast k-NN classifiers have been developed; most of the rely on metric properties (usually the triangle inequality) to reduce the number of prototype comparisons. Hence, the existing fast k-NN classifiers are applicable only when the comparison function is a metric (commonly for numerical data). However, in some sciences such as Medicine, Geology, Sociology, etc., the prototypes are usually described by qualitative and quantitative features (mixed data). In these cases, the comparison function does not necessarily satisfy metric properties. For this reason, it is important to develop fast k most similar neighbor (k-MSN) classifiers for mixed data, which use non metric comparisons functions. In this thesis, four fast k-MSN classifiers, following the most successful approaches, are proposed. The experiments over different datasets show that the proposed classifiers significantly reduce the number of prototype comparisons. | en-US |
dc.description | El clasificador k vecinos más cercanos (k-NN) ha sido ampliamente utilizado dentro del Reconocimiento de Patrones debido a su simplicidad y buen funcionamiento. Sin embargo, en aplicaciones en las cuales el conjunto de entrenamiento es muy grande, la comparación exhaustiva que realiza k-NN se vuelve inaplicable. Por esta razón, se han desarrollado diversos clasificadores rápidos k-NN; la mayoría de los cuales se basan en propiedades métricas (en particular la desigualdad triangular) para reducir el número de comparaciones entre prototipos. Por lo cual, los clasificadores rápidos k-NN existentes son aplicables solamente cuando la función de comparación es una métrica (usualmente con datos numéricos). Sin embargo, en algunas ciencias como la Medicina, Geociencias, Sociología, etc., los prototipos generalmente están descritos por atributos numéricos y no numéricos (datos mezclados). En estos casos, la función de comparación no siempre cumple propiedades métricas. Por esta razón, es importante desarrollar clasificadores rápidos basados en la búsqueda de los k vecinos más similares (k-MSN) para datos mezclados que usen funciones de comparación no métricas. En esta tesis, se proponen cuatro clasificadores rápidos k-MSN, siguiendo los enfoques más exitosos. Los experimentos con diferentes bases de datos muestran que los clasificadores propuestos reducen significativamente el número de comparaciones entre prototipos. | es-ES |
dc.format | application/pdf | |
dc.language | spa | |
dc.publisher | Computación y Sistemas | es-ES |
dc.relation | http://ojs.unam.mx/index.php/cys/article/view/26064/24533 | |
dc.source | Computación y Sistemas; Vol 14, No 001 (2010) | es-ES |
dc.source | 1405-5546 | |
dc.subject | Nearest neighbor rule; fast nearest neighbor search; mixed data; non-metric comparison functions | en-US |
dc.subject | Regla del vecino más cercano; búsqueda rápida del vecino más cercano; datos mezclados; funciones de comparación no métricas | es-ES |
dc.title | Fast Most Similar Neighbor (MSN) classifiers for Mixed Data | en-US |
dc.title | Clasificadores Rápidos basados en el algoritmo del Vecino más Similar (MSN) para Datos Mezclados | es-ES |
dc.type | Artículos de revistas | |
dc.type | Artículos de revistas |