Tesis
Comparação entre algoritmos de reconhecimento de face no contexto de acessibilidade
Comparison between face recognition algorithms in acessibility context
Registro en:
Autor
Parra, Douglas Eduardo, 1987-
Institución
Resumen
Orientador: Siome Klein Goldenstein Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação Resumo: Nesta dissertação de mestrado, é mostrada uma comparação entre três algoritmos de reconhecimento de face no contexto de acessibilidade para o projeto Microsoft com parceria com a FAPESP, para o módulo de reconhecimento de pessoas utilizando o Microsoft Kinect e substituição sensorial. O algoritmo k-Nearest Neighbours, junto do descritor Histograma de Gradientes Orientados, foi utilizado como base por ser uma abordagem simples e de baixo custo computacional. Os algoritmos Eigenfaces e Local Binary Pattern Histogram foram comparados com o anterior em quatro experimentos. Inicialmente, é descrito o Projeto Vision for the Blind e seus diversos módulos. Este projeto foi desenvolvido por uma equipe aqui no Brasil, que obteve bons resultados para os módulos de navegação e reconhecimento de face, sempre com a ideia de usar o áudio 3D para passar a informação desejada ao usuário. Em seguida, é apresentada uma revisão do estado da arte com projetos no contexto de acessibilidade e substituição sensorial, apontando suas limitações. Logo após é feita uma revisão sobre os três algoritmos de reconhecimento facial utilizados e, então, como foi construída o banco de imagens deste projeto. Foram obtidos bons resultados com os três algoritmos, apesar de haver diferenças significativas entre eles. O Eigenfaces e o Local Binary Pattern Histogram, por serem técnicas mais complexas que o k-Nearest Neighbours, atingiram taxas de reconhecimento com metade dos recursos que este último utiliza para chegar próximo dos valores, sendo o Eigenfaces mais rápido, porém demorado na parte de aprendizagem. Ainda assim, por ser uma técnica simples, vale notar o quão bem o k-NN executa a mesma tarefa e pode ser utilizado para o módulo do projeto Abstract: In this master dissertation is shown a comparison between three face recognition algorithms within the context of accessibility to the Microsoft project in partnership with FAPESP for the people recognition module using Microsoft Kinect and sensory substitution. The k-Nearest Neighbours algorithm, with Histogram of Oriented Gradients, was employed as a basis for being a simple and low computational cost. The Eigenfaces and Local Binary Patter Histogram algorithms were compared with the previous one in four experiments. Initially, the Project Vision for the Blind and its different modules is described. This project was developed by a team in Brazil which achieved good results for navigation and face recognition modules, always with the idea of using audio 3D to convey the desired information to the user. It will next be shown a review of the state of art with projects within the context of accessibility e sensory substitution, pointing out its limitations. Immediately after it is done a review about the three face recognition algorithms used and then how the image database from this project was created. Good results were achieved with the three algorithms although there are significant differences among them. Eigenfaces and Local Binary Pattern Histogram, for being more complex techniques than k-Nearest Neighbours, reached recognition rates with half of the resources than the last one use to get close to the result values, with Eigenfaces being the fastest. Nonetheless, for being a simple technique, it is worth take note how good k-NN executes the same task and could be used in the project module Mestrado Ciência da Computação Mestre em Ciência da Computação CAPES FAPESP