dc.contributorBuchan, Susannah
dc.contributorBecerra Yoma, Néstor
dc.contributorMahu Sinclair, Rodrigo
dc.creatorHoffmann Vásquez, Reinaldo Cristián
dc.date.accessioned2021-09-08T12:36:48Z
dc.date.available2021-09-08T12:36:48Z
dc.date.created2021-09-08T12:36:48Z
dc.date.issued2021
dc.identifierhttps://repositorio.uchile.cl/handle/2250/181868
dc.description.abstractEn este trabajo se busca detectar y clasificar correctamente eventos presentes en grabaciones submarinas capturadas en las costas de la isla de Juan Fernández, Chile. Para la detección y clasificación se aplican técnicas de machine learning, en particular se utilizan modelos ocultos de Markov (HMM), redes neuronales profundas (DNN) y mezclas de gaussianas (GMM). Todos los modelos utilizados consisten en un modelo oculto de Markov, cuyas probabilidades de observación son calculadas de dos formas distintas. Primero se prueba utilizando una mezcla de gaussianas para obtener las probabilidades y posteriormente se utiliza una red DNN en su lugar. Se dispone de 1.381 grabaciones de aproximadamente 10 minutos, correspondiente a 236 horas totales de audio. En las grabaciones aparecen 40.857 eventos distintos de silencio. Se usan 24 clases distintas para realizar la clasificación, entre las que se tienen vocalizaciones de ballenas azules, vocalizaciones de ballenas sei, vocalizaciones de ballenas minke, sonidos provenientes de barcos, sonidos asociados a movimientos sísmicos, entre otros. La base de datos presenta un gran desbalance de clases debido a que gran parte de las grabaciones corresponde a silencio y ruido de fondo. Para evaluar los resultados se utilizan tres métricas: el porcentaje de clasificaciones correctas total, el porcentaje de clasificaciones correctas de los eventos distintos de silencio y el porcentaje de clasificaciones correctas de los eventos sísmicos. Se calcula el accuracy de este evento en particular debido al interés práctico por las posibles aplicaciones de la detección y clasificación de movimientos sísmicos. Se obtienen porcentajes de accuracy total de 90% aproximadamente, tanto usando modelos HMM con redes DNN como usando modelos HMM con GMM. El porcentaje de clasificaciones correctas de los eventos sísmicos usando redes DNN es muy alto, superando 97% en varios experimentos. Por otra parte, el porcentaje de clasificaciones correctas de todas las etiquetas distintas de silencio son menores, fluctuando entre 50% y 30% en la mayoría de los experimentos. Se concluye que el gran desbalance de clases, con la mayoría de los frames correspondientes a silencio, afecta la clasificación de los demás eventos. Los modelos con mezcla de gaussianas entregan un mayor porcentaje de clasificaciones correctas de las etiquetas distintas de silencio y modelos con DNN clasifican de mejor manera los eventos sísmicos, por lo que se concluye que el mejor modelo depende de cuál de estos factores resulta más importante para la aplicación en particular.
dc.languagees
dc.publisherUniversidad de Chile
dc.rightshttp://creativecommons.org/licenses/by-nc-nd/3.0/cl/
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Chile
dc.subjectIsla juan Fernandez - Chile
dc.subjectReproducción del sonido - Chile
dc.subjectSonido - Mediciones
dc.subjectDeteccion de señales no parametricas
dc.subjectAlgoritmos computacionales
dc.titleDetección y clasificación de señales submarinas con técnicas de Machine Learning
dc.typeTesis


Este ítem pertenece a la siguiente institución