Tesis
Reconocimiento facial : FaceNet y AWS rekognition
Fecha
2020Registro en:
Autor
Diaz y Diaz, Juan Francisco
Institución
Resumen
Resumen: La evolución de tecnología y las comunicaciones nos ha permitido representar nuestro entorno
en formato digital tanto en texto como en imágenes y video. La digitalización del medio que nos
rodea dió la posibilidad de capturar grandes conjuntos de datos dando lugar a conceptos como
"Big Data". Muchos de estos conjuntos pueden ser descargados gratuitamente de Internet e
incluso hay competencias como ILSVRC (ImageNet Large Scale Visual Recognition Challenge)
y COCO (Common Objects in Context) , entre otros, donde se ponen a prueba algoritmos de
clasificación de imágenes.
El desafío que propone Big Data no radica únicamente en el manejo de grandes conjuntos de
datos sino también en el valor que podamos obtener de estos. Como consecuencia surge la
necesidad de poder extraer patrones a partir de esta información de manera simple e
involucrando lo menos posible al ser humano.
La solución a este desafío que ha ganado auge durante la última década es "Deep Learning" y
esto se debe no solo a la habilidad de acceder fácilmente a dichos conjuntos de datos sino
también al avance en la capacidad de cómputo tanto de CPU como GPU y la disponibilidad de
herramientas que permiten enfocarse en el desarrollo de la idea y no en la complejidad del
problema. Podemos destacar herramientas como Scikit-learn, Tensorflow, Keras y servicios
en cloud que permiten implementar Machine Learning y Deep Learning de manera accesible,
sencilla y en poco tiempo.
En este trabajo se implementará un algoritmo de reconocimiento facial y se lo comparará con
un servicio similar en cloud. Para poder dar contexto a la solución, se repasará brevemente la
historia de Machine Learning desde sus comienzos en 1950 con la definición de la primer
neurona Perceptron a su rápida evolución en la última década. También será necesario
desarrollar conceptos teóricos de Machine Learning, haciendo énfasis en la clasificación de
imágenes utilizando Neural Networks y Deep Learning.
La implementación estará dividida en dos partes, la primera basada en el paper " FaceNet: A
Unified Embedding for Face Recognition and Clustering " donde se utilizará el concepto de transfer learning para extender y aplicar un modelo preexistente sobre un conjunto de datos. La
segunda implementación estará basada en el servicio cloud " AWS Rekognition ".
Estas dos implementaciones permitirán no solo utilizar conceptos de Deep Learning sino
también realizar comparativas de:
● Costos
● Complejidad
● Performance
● Nivel de confianza en las predicciones
● Escalabilidad de la solución