info:eu-repo/semantics/masterThesis
Aprendizaje de conceptos visuales basado en múltiples clasificadores
Autor
DULCE JAZMIN NAVARRETE ARIAS
Resumen
Object recognition is usually based on learning from a large dataset of previously selected
training images; however, not all objects have one associated dataset. Nowadays
it is possible to find images on Internet of virtually any object, only by launching a
query with the object's name in a search engine. Nevertheless, this strategy introduces
computational challenges: (i) the object's name can have more than one meaning; (ii)
the object can have different appearances, and (iii) without prior knowledge of the
object it is hard to identify which visual features to use in order to train a classifier.
In this thesis a method to tackle the above problem is proposed. The method incorporates
an ensemble of classifiers that builds several object models treating intraclass
variability. Responses of every classifier are combined to determine the presence or
absence of the object. The method begins with a small training set obtained via Web,
and a series of image transformations is applied in order to identify invariant features.
The weight of the local and global features is optimized, in order to recognize different
category types.
We also develop an algorithm based on sliding windows to identify the object's
position within an image. We evaluated our method on images from the Web, the
Caltech-7 dataset and real environments. We compared our method against related
work, obtaining competitive classification performance in the recognition of general
and specific objects. El reconocimiento de objetos tradicionalmente está basado en realizar aprendizaje sobre
un gran conjunto de entrenamiento de imágenes previamente seleccionadas, sin
embargo, no todos los objetos cuentan con un conjunto de datos asociado. Hoy en día
es posible encontrar en Web imágenes de prácticamente cualquier objeto, únicamente
basta con lanzar una consulta con el nombre del objeto en un motor de búsqueda para
obtener un conjunto de entrenamiento. Esta estrategia, sin embargo, introduce retos
computacionales a resolver: (i) el nombre del objeto puede tener más de un significado,
(ii) el objeto puede tener diferentes presentaciones y (iii) sin tener conocimiento previo
del objeto es difícil identificar qué características visuales usar en un clasificador.
Esta tesis propone un nuevo método que ataca la anterior problemática. El método
incorpora un esquema de ensamble de clasificadores que construyen varios modelos
del objeto permitiendo tratar la variabilidad intraclase, las respuestas de los clasificadores son combinadas para determinar la presencia o ausencia del objeto. Parte de
un pequeño conjunto de entrenamiento obtenido en Web, al cual se le aplica una serie
de transformaciones, para identificar características invariantes. La contribución de
características locales y globales que describen al objeto es optimizada, con el _n de
reconocer diferentes tipos de categorías. También desarrollamos un algoritmo basado
en ventanas que identifica la posición del objeto dentro de una imagen.
Evaluamos nuestro método sobre imágenes de Web, la base de datos Caltech-7
y en entornos reales. Nos comparamos contra trabajos reportados en el estado del
arte, obteniendo resultados que muestran porcentajes de clasificación competitivos en el reconocimiento de objetos específicos y generales.
Materias
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Compendio de innovaciones socioambientales en la frontera sur de México
Adriana Quiroga -
Caminar el cafetal: perspectivas socioambientales del café y su gente
Eduardo Bello Baltazar; Lorena Soto_Pinto; Graciela Huerta_Palacios; Jaime Gomez -
Material de empaque para biofiltración con base en poliuretano modificado con almidón, metodos para la manufactura del mismo y sistema de biofiltración
OLGA BRIGIDA GUTIERREZ ACOSTA; VLADIMIR ALONSO ESCOBAR BARRIOS; SONIA LORENA ARRIAGA GARCIA