Proyecto Final de Grado
Detección de objetos por computador
Fecha
2017Autor
Villanueva, Rodolfo Martín
Institución
Resumen
Este trabajo tiene por fin desarrollar una aplicación de detección y reconocimiento de objetos. La visión por
computador es un tema específico dentro de lo que se conoce como "Machine Learning" o "Aprendizaje
Automático" en español. Investigando el tema se concluye que no existe una única técnica eficaz para detectar
distintas clases de objetos en todas las situaciones. Existen técnicas que han probado su efectividad para algunas
clases de objetos. La intención primaria de este trabajo es desarrollar y evaluar algunas de las principales técnicas
de visión por computador que permiten detectar y reconocer personas en una imagen.
Por lo tanto, en este trabajo se profundizara en el tema de la detección de una determinada clase de objetos, en
este caso de personas. Cuando en este documento se habla de detección de objetos, se hace referencia a utilizar
técnicas de visión por computador. En principio se puede pensar en tener una sola imagen y detectar objetos
dentro de esa imagen, (en este caso, personas) o se puede pensar en tener videos, es decir, una secuencia de
imágenes, y detectar objetos en esa secuencia. Este trabajo se centrara en el caso de tener una sola imagen y
tener que buscar los objetos en esa imagen. Se utilizara principalmente la apariencia visual de los objetos para
desarrollar un ejemplo de aplicación de detección de personas, ya que hay otras técnicas que se basan en los
colores de los pixeles, pero que no se desarrollara aquí. Siendo un poco más específico, se partirá de un modelo, y
lo que se quiere, es saber en qué lugares aparece ese modelo dentro de la imagen.
La visión por computador no es un tema fácil. Como humanos, si se presenta una imagen y se pide buscar objetos
en ella, se hace con relativa sencillez. Sin embargo, para un sistema automático no es tan sencillo. Solo en la última
década se ha empezado a obtener resultados que pueden ser usados en ciertas aplicaciones. La detección de
objetos sigue siendo un campo de investigación en la actualidad. Lo que se quiere, es poder distinguir una clase de
objetos de otra. El modelo de las personas no puede ser igual que el modelo de cualquier otro objeto.
Por otra parte, los modelos tienen que presentar invariancia a la propia variabilidad que existe en las clases de
objetos. Por ejemplo, si se busca personas en una imagen, los individuos en ella tendrán distinta ropa, con distintas
localizaciones, con distintas posturas, existirán oclusiones, etc.Además en esa imagen se tiene que tener en cuenta las condiciones distintas del entorno, por ejemplo, si el día es
soleado o es nublado, es decir que los objetos que se busquen deben ser independientes de esas condiciones.
Por otro lado, se tiene la propia búsqueda de los objetos en la imagen, que proporciona todas las posibles
ventanas que puedan contener los objetos que interesan y da todas las posibilidades para encontrar al objeto. Por
otra parte esto tiene que ser un mecanismo de búsqueda lo suficientemente eficiente.
Por último, es necesario aclarar que la visión por computador es un tema en continuo desarrollo y con
numerosas fuentes, que hace que se encuentren muchos temas con el mismo nombre, desarrollados con
notorias diferencias, entre una fuente y otra. Esto obliga a desarrollar el marco teórico del presente documento
en forma un poco más detallada, para poder aclarar, en forma precisa, a que se hace referencia.