Dissertação
Reconhecimento de padrões em imagens por descritores de forma
Pattern recognition in images via shape descriptors
Autor
Erpen, Luis Renato Cruz
Resumen
A idéia de capacitar uma máquina a reconhecer o ambiente em que atua tem motivado pesquisadores a investir esforços no estudo do mais complexo dos sentidos humanos, a visão. A visão é, antes de tudo, uma tarefa de representação e processamento de informações, sendo portanto adequada ao tratamento computacional. Visto que ainda não se possuem métodos que tenham resultados equivalentes ao que seria obtido com um usuário humano, tem-se estudado intensamente a utilização de feições para um melhor aproveitamento de seu potencial. Dentre estas feições, a forma de um objeto proporciona um poderoso indício de sua identidade e funcionalidade, podendo ser utilizada para seu reconhecimento. Isso distingue a forma de outras feições visuais elementares, como a cor, o movimento ou a textura, que, apesar de igualmente importantes, normalmente não revelam a identidade de um objeto. Assim sendo, a possibilidade de avaliar a robustez e a estabilidade de técnicas alternativas para a representação de forma é vital para prever o desempenho de cada técnica na presença de alguma incerteza ou discrepância. Neste trabalho, alguns descritores de forma descritos na literatura foram implementados e utilizados em estudos de caso para avaliar sua eficácia. Estes estudos de caso foram realizados utilizando-se caracteres, todavia, com finalidades bastante distintas. O primeiro estudo de caso é voltado para aplicações como a robótica móvel, com reconhecimento de comandos localizados no ambiente por parte do robô. Já o estudo de caso principal está direcionado para aplicações de reconhecimento de placas de automóveis, que poderia tanto ser utilizado para monitoramento e controle do fluxo de trânsito, quanto para controle de infrações. Muitas aplicações, incluindo aquelas que envolvem a recuperação e indexação de objetos visuais, são apropriadas para a utilização de feições de forma. Outra característica importante do presente trabalho é a de realçar que a seleção de um bom descritor reduz o esforço necessário na etapa de classificação, o qual é computacionalmente elevado. The idea of enabling a machine to recognize the environment with which it interacts has motivated researchers to dedicate efforts in studying the most complex of the human senses: vision. Vision is essentially a task of information representation and processing, what makes it suitable for computational treatment. Given that currently there are no methods that perform equivalently to humans, the use of features has been intensively studied in order to improve the performance of the existing methods. Among these features, the shape of an object provides a powerful sign of its identity and functionality, what enables the exploitation of this feature with the purpose of recognition. This evidence distinguishes shape from other visual features, such as color, motion or texture, which, although equally important, normally do not reveal the identity of an object. As a result, the possibility of evaluating the robustness and stability of alternate techniques for shape representation is essential in order to measure the performance of each technique in the presence of uncertainty. In this work, some shape descriptors available in the literature were implemented and used in case studies aiming at evaluating their effectiveness. These case studies were carried out using characters, although, with very different purposes. The first case study is geared towards applications such as mobile robotics, where the robot recognizes commands available in the environment. The main case study is focused on applications of license plate recognition, which could be used both in situations of surveillance and traffic control and in situations of infraction. Many applications, including those that involve the search and indexing of visual objects, are suited for the use of shape features. Another important characteristic of this work is that it emphasizes that the selection of a good shape description reduces the effort during the classification step, which is computationally elevated.