dc.contributor | JOSE FRANCISCO MARTINEZ TRINIDAD | |
dc.contributor | JESUS ARIEL CARRAZCO OCHOA | |
dc.creator | JOSE ARTURO OLVERA LOPEZ | |
dc.date | 2009-03 | |
dc.date.accessioned | 2023-07-25T16:21:32Z | |
dc.date.available | 2023-07-25T16:21:32Z | |
dc.identifier | http://inaoe.repositorioinstitucional.mx/jspui/handle/1009/424 | |
dc.identifier.uri | https://repositorioslatinoamericanos.uchile.cl/handle/2250/7805642 | |
dc.description | In Pattern Recognition, the supervised classifiers assign a label or class to
unseen objects or prototypes. For classifying new prototypes a set of prototypes
called training set is used, this set provides useful information to the classifiers
during the training stage. In practice, not all the information in the training set
is useful so it is possible to discard irrelevant prototypes from the training set.
This process is known as prototype selection and it is the main topic of this
research.
Through prototype selection the training set size is reduced which allows
reducing the runtimes in the classification and/or training stages of the
classifiers with acceptable classification accuracy, which is the purpose of the
prototype selection.
In the literature, several methods have been proposed for selecting
prototypes however, their performance is strongly related to the use of a specific
classifier and when different classifiers are used, the performance of these
methods decreases. In addition, most of the methods spend long time selecting
prototypes when large datasets are processed and in some cases, they cannot be
applied.
The contribution of this research are four methods for selecting prototypes
which solve drawbacks of some methods in the state of the art. The first two
methods are based on the sequential search and the remaining methods uses
clustering and prototypes relevance for selecting border prototypes.
According to the results reported in this work, the proposed methods are a
good option for solving the prototype selection problem. In addition, two of the
proposed methods are faster than other methods from the state of the art
mainly in the large-training sets case. | |
dc.description | En reconocimiento de patrones, los clasificadores supervisados asignan una
clase a nuevos objetos o prototipos. Para llevar a cabo este proceso se usa un
conjunto de entrenamiento, mediante el cual se proporciona información al
clasificador durante su etapa de entrenamiento. En la práctica, no toda la
información en los conjuntos de entrenamiento es útil, por lo que es necesario
descartar algunos prototipos del conjunto de entrenamiento. A este proceso se le
denomina selección de prototipos, la cual corresponde al área en que se ubica el
trabajo de investigación de esta tesis.
Mediante la selección de prototipos se reduce el tamaño de un conjunto de
entrenamiento y como consecuencia, se reducen los tiempos de ejecución en los
procesos de clasificación y/o entrenamiento con una calidad de clasificación
aceptable con respecto a la obtenida con los conjuntos originales de
entrenamiento. Siendo ésta la principal utilidad de la selección de prototipos.
Se han propuesto diversos métodos para la selección de prototipos, varios de
ellos presentan un buen desempeño pero la selección está fuertemente ligada al
uso de un clasificador particular, por lo que, cuando se requieren utilizar otros
clasificadores, el desempeño de estos métodos se ve afectado. Otra de las
características que presentan los métodos del estado del arte es que el tiempo
requerido por éstos para llevar a cabo la selección crece cuando el conjunto de
entrenamiento es grande, lo cual provoca que sean métodos costosos y, en
algunas ocasiones, inaplicables.
La contribución de este trabajo son métodos para la selección de prototipos
que solucionan las limitantes de algunos de los métodos existentes, tales como
altos tiempos de ejecución y la dependencia del uso de algún clasificador
particular en el desempeño de los métodos de selección. En particular, se
proponen cuatro métodos para la selección de prototipos; dos de ellos se basan
en la búsqueda secuencial y los restantes en la selección de prototipos borde
mediante agrupamientos y relevancia de prototipos, respectivamente.
De acuerdo a los experimentos realizados y resultados obtenidos, los métodos
propuestos presentan una solución al problema de la selección de prototipos
considerando las limitantes en los métodos relevante existentes. Dos de estos
métodos llevan a cabo la selección en un tiempo mucho menor con respecto a
otros métodos para el caso específico de grandes conjuntos de datos. | |
dc.format | application/pdf | |
dc.language | spa | |
dc.publisher | Instituto Nacional de Astrofísica, Óptica y Electrónica | |
dc.relation | citation:Olvera-Lopez J.A. | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | http://creativecommons.org/licenses/by-nc-nd/4.0 | |
dc.subject | info:eu-repo/classification/Reconocimiento de patrones/Pattern recognition | |
dc.subject | info:eu-repo/classification/Análisis de los datos/Data analysis | |
dc.subject | info:eu-repo/classification/Inteligencia artificial./Artificial intelligence | |
dc.subject | info:eu-repo/classification/cti/1 | |
dc.subject | info:eu-repo/classification/cti/12 | |
dc.subject | info:eu-repo/classification/cti/1203 | |
dc.subject | info:eu-repo/classification/cti/1203 | |
dc.title | Métodos para la selección de prototipos | |
dc.type | info:eu-repo/semantics/doctoralThesis | |
dc.type | info:eu-repo/semantics/acceptedVersion | |
dc.audience | students | |
dc.audience | researchers | |
dc.audience | generalPublic | |