dc.contributorSánchez, Jorge Adrián, dir.
dc.creatorPastore, Pablo Andrés
dc.date.accessioned2019-07-19T11:48:38Z
dc.date.accessioned2022-10-14T18:10:21Z
dc.date.available2019-07-19T11:48:38Z
dc.date.available2022-10-14T18:10:21Z
dc.date.created2019-07-19T11:48:38Z
dc.date.issued2018-05
dc.identifierhttp://hdl.handle.net/11086/11694
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/4265480
dc.description.abstractEn este trabajo se abordará el problema de reconocimiento facial en imágenes utilizando redes neuronales convolucionales. El éxito actual en los resultados obtenidos por este tipo de modelos yace principalmente en la posibilidad de contar con grandes volúmenes de datos anotados para su entrenamiento. Con respecto al reconocimiento facial, la disponibilidad de bases de datos públicas para este tipo de problemas es escasa, restringiendo los avances en el área de los últimos años a grandes empresas como Facebook, Google, Baidu, etc. En nuestros experimentos, tomaremos como punto de partida una red neuronal convolucional entrenada sobre una base de datos de rostros varios órdenes de magnitud menor a aquellas utilizadas comúnmente por el estado del arte. Usaremos vectores de características obtenidos con este modelo para entrenar un mapeo bilineal mediante una función de costo conocida como Triplet Loss. El objetivo del modelo final es obtener resultados cercanos al estado del arte, pero, utilizando un conjunto de datos de entrenamiento reducido.
dc.description.abstractIn this work we address the problem of facial recognition on images using convolutional neural networks. Successful results obtained by these models relies mainly on the availability of large amounts of manually annotated data for training. For the task of facial recognition, the lack of large-scale publicly available datasets has restricted most advances in the field to big companies like Facebook, Google, Baidu, etc. In our experiments, we start from a simple convolutional neural network trained on a standard facial recognition dataset several orders of magnitude smaller than those used by the state-of-the-art. We use features extracted from this model to train a bilinear map using a cost function known in the literature as Triplet Loss. The goal of such model is to get results as close as possible to those obtained by state-of-the-art models but using a much smaller training set.
dc.languagespa
dc.rightshttp://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rightsAtribución-NoComercial-CompartirIgual 4.0 Internacional
dc.subjectMetodologías de computación
dc.subjectRedes neuronales
dc.subjectComputing methodologies
dc.subjectNeural networks
dc.titleReconocimiento facial en imágenes
dc.typebachelorThesis


Este ítem pertenece a la siguiente institución