dc.creatorMarco Tulio Pérez Ortega
dc.date2021-12-01
dc.date.accessioned2023-07-21T15:46:57Z
dc.date.available2023-07-21T15:46:57Z
dc.identifierhttp://cimat.repositorioinstitucional.mx/jspui/handle/1008/1133
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/7729668
dc.descriptionEn la actualidad, la mayor parte de los datos usados para abordar distintas tareas de aprendizaje máquina, tanto supervisado como no supervisado, son multimodales, es decir, se componen de distintos elementos de información que pueden provenir de distintas fuentes. Aunque tradicionalmente se han analizado las diferentes modalidades por separado, han surgido diferentes metodologías de inteligencia artificial que permiten incorporar todas las modalidades de información de los datos, y por ésta razón, los modelos con datos multimodales se ha convertido en un campo de investigación muy activo actualmente. Para el análisis de colecciones musicales, el enfoque multimodal constituye un reto, debido a la compleja naturaleza de cada modalidad de información, sumado a la poca disponibilidad de recursos de uso libre. Para hacer frente a esta problemática, en ésta tesis creamos y analizamos un conjunto de datos multimodales compuesto por señales de audio, texto, imágenes y una matriz pista-tag con el fin de crear representaciones vectoriales que mejor representen cada pista en nuestro conjunto de datos. Para esto, usamos técnicas de aprendizaje profundo, procesamiento de señales y procesamiento de lenguaje natural. Finalmente verificamos el desempeño de éstas representaciones con tareas de clasificación de género, y recuperación de información, mostrando buenos resultados al compararlos con métodos reportados en la literatura.
dc.formatapplication/pdf
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightshttp://creativecommons.org/licenses/by-nc/4.0
dc.subjectinfo:eu-repo/classification/MSC/COMPUTO ESTADÍSTICO
dc.subjectinfo:eu-repo/classification/cti/1
dc.subjectinfo:eu-repo/classification/cti/12
dc.subjectinfo:eu-repo/classification/cti/1299
dc.subjectinfo:eu-repo/classification/cti/129999
dc.subjectinfo:eu-repo/classification/cti/129999
dc.titleAnálisis de Datos Multimodales en Colecciones Musicales
dc.typeinfo:eu-repo/semantics/other
dc.typeinfo:mx-repo/semantics/masterDegreeWork
dc.typeinfo:eu-repo/semantics/acceptedVersion


Este ítem pertenece a la siguiente institución