TESIS
Algoritmo adaptativo para el reconocimiento facial tolerante a gestigulaciones, pose y ruido de escena
Fecha
2018-09-06Registro en:
Cuevas Romano, Andrés Joel. (2017). Algoritmo adaptativo para el reconocimiento facial tolerante a gesticulaciones, pose y ruido de escena (Doctorado en Ciencias en Sistemas Digitales). Instituto Politécnico Nacional, Centro de Investigación y Desarrollo de Tecnología Digital, México.
Autor
Cuevas Romano, Andrés Joel
Institución
Resumen
RESUMEN: Los filtros de correlación han sido usados en los utlimos años como una alternativa a los métodos basados en características locales para resolver problemas de reconocimiento de patrones. Comúnmente, los filtros de correlación se construyen como una combinación de plantillas de entrenamiento, seleccionadas por el diseñador para un propósito específico. Sin embargo, para aplicaciones avanzadas como el reconocimiento de rostros, el problema de encontrar el mejor subconjunto de plantillas de entrenamiento para lograr un desempeño óptimo aún no ha sido resuelto. En este trabajo de tesis, se presenta un nuevo enfoque para el diseño e implementación de filtros de correlación para reconocimiento de rostros. El enfoque consiste en dos etapas, entrenamiento y reconocimiento. En la etapa de entrenamiento, dado un conjunto de imágenes de rostros, un algoritmo iterativo basado en optimización combinatoria multiobjetivo es usado para construir un banco de filtros con un desempeño optimizado en términos de varios criterios que compiten entre sí. La etapa de reconocimiento, consiste en un algoritmo basado en filtros de correlación para el reconocimiento de rostros con tolerancia a distorsiones en la escena. Dada una imagen de entrada con un rostro, se obtiene un conjunto de planos de correlación al procesar la imagen de entrada con un rostro, se obtiene un conjunto de planos de correlación al procesar la imagen de entrada con un banco de filtros, creado previamente en la etapa de entrenamiento. Posteriormente, se utiliza un clasificador Bayesiano para asignar la imagen de entrada a una categoría correspondiente a través del procesamiento de rasgos extraídos de los planos de correlación. Los resultados obtenidos con el método propuesto en imágenes reales de bases de datos son presentados y comparados en términos de métricas objetivas con los resultados obtenidos usando los métodos eigenfaces, Fisherfaces, patrones locales binarios y otros filtros de correlación del estado del arte. Los resultados muestran que el método propuesto tiene el mejor desempeño cuando el número de plantillas de entrenamiento es mejor y su desempeño es comparable con métodos exitosos del estado del arte cuando se procesan imágenes ruidosas.
ABSTRACT: Correlation fi lters represent an attractive alternative to feature based methods for solving a wide variety of pattern recognition problems. Commonly, correlation lters are constructed by a combination of several training templates chosen for a specifi c purpose by a designer. However, for advanced pattern recognition problems, such as face recognition, fi nding the best subset of templates for optimum lter design still remains unsolved. In this thesis, we present a new approach for the design and implementation of composite correlation fi lters that consists of two stages, training and recognition. In the training stage, given a vast search space of face images, an iterative algorithm based on muliobjective combinatorial optimization is used to synthesize a lter bank with optimized
performance in terms of several competing criteria. The recognition stage consists of a
proposed correlation based algorithm for face recognition, with tolerance to scene distortions. Given an input face image, a set of correlation planes is obtained by processing the input image with a lter bank created in the training stage. Next, a Bayes classi er is used to classify the input image using extracted features from the correlation planes. Results obtained with the proposed method are presented, discussed and compared with those obtained in terms of objective metrics with existing state-of-the-art lters and the eigenfaces, Fisherfaces and local binary patterns algorithms. The obtained results show that the proposed method outperforms existing methods when using less training templates, and its performance in terms of objective metrics is comparable with successful state-of-the-art methods when processing noisy input scenes.