Tesis
Técnicas de combinação de evidências para problemas de reconhecimento em cenário aberto
Data fusion techniques for open set recognition problems
Registro en:
Autor
Córdova Neira, Manuel Alberto, 1986-
Institución
Resumen
Orientador: Ricardo da Silva Torres Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação Resumo: Na atualidade a maioria das técnicas para classificação de padrões na área de aprendizado de máquina foca a resolução de problemas de cenário fechado. Nestes problemas, o classificador é treinado com amostras de todas as classes que serão observadas na fase de teste. Em muitas situações, no entanto, amostras de classes desconhecidas, i.e., classes não encontradas na fase de treino, necessitam ser tratadas. Este tipo de cenário é conhecido como um problema de reconhecimento em cenário aberto. Neste trabalho, propomos métodos que combinam diferentes tipos de características para reconhecimento de objetos em cenário aberto. Os métodos estão baseados no classificador \emph{Optimum-Path Forest} (OPF) e utilizam Programação Genética (GP) e Contagem de Votos (\emph{Majority-Voting}) como técnicas de combinação de evidências. O OPF é um classificador multiclasse, rápido (especialmente durante a fase de treino) e está baseado em grafos. A GP é uma técnica inspirada na evolução biológica que é usada para a descoberta de funções de similaridade entre objetos. As funções de similaridade baseadas na GP combinam diferentes tipos de características visuais dos objetos (e.g., cor, textura, e forma). O \emph{Majority-Voting} combina diferentes dados operando diretamente nas etiquetas atribuídas por classificadores isolados que utilizam diferentes descritores de características. Os experimentos realizados considerando dois conjuntos de imagens demonstram que o enfoque proposto de fusão híbrida de dados produz resultados eficientes Abstract: Nowadays, most of the techniques for pattern classification in the machine learning area are focused on solving closed-set problems. In these problems, the classifier is trained with samples of all the classes that will appear in the testing phase. In many situations, however, samples of unknown classes, i.e., classes not present in the training stage, need to be handled. This kind of scenario is known as an Open-set recognition problem. In this work, we propose methods that combine different types of features for object recognition in Open-set problems. Our methods are based on the Optimum-Path Forest (OPF) classifier and use Genetic Programming (GP) and Majority-Voting as data fusion techniques. The OPF is a fast (specially during the training phase) graph-based multiclass classifier. The GP is a technique inspired in the biological evolution, which is used to discover appropriate similarity functions among objects. The GP-based similarity functions combine different kinds of object visual properties (e.g., color, texture, and shape). The Majority-Voting combine data working directly with the output (label) of isolate classifiers that use different kinds of features. Performed experiments considering two datasets demonstrate that the proposed hybrid data fusion approach yields effective results in Open-set recognition problems Mestrado Ciência da Computação Mestre em Ciência da Computação 484254/2012-0 e 306580/2012-8 CNPQ CAPES