dc.contributor | JOSE FRANCISCO MARTINEZ TRINIDAD | |
dc.creator | MILTON GARCÍA BORROTO | |
dc.date | 2007 | |
dc.date.accessioned | 2018-11-19T14:28:01Z | |
dc.date.available | 2018-11-19T14:28:01Z | |
dc.identifier | http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/598 | |
dc.identifier.uri | http://repositorioslatinoamericanos.uchile.cl/handle/2250/2258741 | |
dc.description | The k Nearest Neighbor rule is one of the most popular classifiers used nowadays,
because of its simplicity and good results with not a priori knowledge about statistical
data distribution. However, for practical problems, this rule has some drawbacks. In this
work we face the solution of two of the most important: intolerance to noisy objects and
high computational cost for classification.
In the related literature many methods can be found, with dissimilar behavior in different
databases. A more recent approach is related with synergic methods combination, where
some methods are combined, obtaining a superior behavior.
In this work two new editing methods and two new condensing methods are proposed.
They have a good individual behavior and a very good combined behavior. All of them
can efficiently and correctly deal with mixed and incomplete data. A significant
modification of Pareto frontier, when including our methods in the combinations, shows
an improvement in the state of the art.
A deeper study in different combination strategies reveals some properties of each one.
The relationship between the quality of results and class mixing were also determined.
The degree of class mixing was properly measured using metadata. | |
dc.description | La regla de los k Vecinos más Cercanos es uno de los clasificadores más populares en la
actualidad, tanto por su sencillez de funcionamiento y buenos resultados prácticos, como
por no necesitar ningún conocimiento a priori de las distribuciones de los datos. Sin
embargo, para resolver problemas prácticos, presenta varios inconvenientes. En este
trabajo se aborda la solución de dos de los más importantes: la intolerancia a objetos
ruidosos, y el alto costo computacional de la clasificación.
En la revisión bibliográfica realizada, se pudo verificar que existen una cantidad muy
grande de métodos, con comportamientos disimilares en diferentes bases de datos. Otra
tendencia detectada es la utilización de combinaciones de métodos, que aprovechen de
manera sinérgica las ventajas de cada método, ayudando a mitigar sus puntos débiles.
En este trabajo se presentan dos nuevos métodos de edición y dos nuevos métodos de
condensación, con buen comportamiento individual, y muy buen comportamiento en
combinaciones, tanto con datos mezclados e incompletos como con datos numéricos. La
modificación apreciable de la frontera de Pareto al incluirlos en las comparaciones
muestra que se realizó un aporte al estado del arte.
Un estudio con mayor profundidad de los resultados de diferentes estrategias de
combinación de métodos permitió enunciar propiedades de cada una de ellas. Además se
determinó la dependencia entre la calidad de los resultados de cada estrategia y el
entremezclado de las clases, medido mediante un meta – dato. | |
dc.format | application/pdf | |
dc.language | spa | |
dc.publisher | Instituto Nacional de Astrofísica, Óptica y Electrónica | |
dc.relation | citation:García-Borroto M | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | http://creativecommons.org/licenses/by-nc-nd/4.0 | |
dc.subject | info:eu-repo/classification/Selección de objetos/Object selection | |
dc.subject | info:eu-repo/classification/Combinación de métodos de selección de objetos/Object selection methods combination | |
dc.subject | info:eu-repo/classification/Clasificación supervisada/Supervised classification | |
dc.subject | info:eu-repo/classification/Regla de vecino más cercano/Nearest neighbor rule | |
dc.subject | info:eu-repo/classification/Datos mixtos e incompletos/Mixed and incomplete data | |
dc.subject | info:eu-repo/classification/cti/7 | |
dc.subject | info:eu-repo/classification/cti/33 | |
dc.subject | info:eu-repo/classification/cti/3304 | |
dc.subject | info:eu-repo/classification/cti/120312 | |
dc.title | Nuevos métodos de selección de objetos y su aplicación sinérgica | |
dc.type | Tesis | |
dc.type | info:eu-repo/semantics/acceptedVersion | |
dc.audience | students | |
dc.audience | researchers | |
dc.audience | generalPublic | |