Dissertação
Predição de tags musicais aplicando redes neurais convolucionais em stacking
Registro en:
Autor
Silva, Juliano Donini da
Institución
Resumen
Orientador: Prof. Dr. Marcos Aurélio Domingues Coorientador: Prof. Dr. Yandre Maldonado e Gomes da Costa Dissertação (mestrado em Ciência da Computação) - Universidade Estadual de Maringá, 2020 RESUMO: Anotações de Tags musicais realizada manualmente não é uma tarefa simples, uma vez que quem as executa pode fazê-la de acordo com seu gosto pessoal e/ou ser influenciada pelo contexto social no qual está inserido, além do grande volume de músicas contidas nas bases de dados. Deste modo, se faz necessária a elaboração de métodos automáticos para a tarefa de predição de Tags, buscando melhorar a qualidade dos resultados obtidos em comparação aos métodos de predição automáticos existentes e por consequência facilitando o processo de anotação de Tags. Assim, nesta dissertação, foram propostos dois métodos capazes de melhorar a qualidade das predições de Tags musicais por meio da combinação de Redes Neurais Convolucionais com a técnica de Stacking. A técnica de Stacking usa os resultados obtidos no primeiro estágio de aprendizado como entrada no segundo estágio de aprendizado do modelo de predição. Os métodos propostos foram avaliados em três bases de dados (FMA, MagnaTagATune e Million Song Dataset), utilizando as medidas de Acurácia, Area Under the Roc Curve, Precision Recall Curve e Hamming Loss. Além disso, também foi calculado o tempo de treinamento dos métodos. Os resultados obtidos pelos métodos propostos superaram o Baseline, além de apresentaram uma redução no tempo de treinamento ABSTRACT: Music Tag Annotations performed manually is not a simple task, since those who perform them can do it according to their personal taste and/or be influenced by the social context in which it is inserted, in addition to the large volume of music contained in the databases. Thus, it is necessary to develop automatic methods for the task of predicting tags, seeking to improve the quality of the results obtained in comparison to the existing automatic prediction methods and consequently facilitating the manual process of annotating tags. Thus, in this dissertation, we proposed two methods capable of improving the quality of tag prediction through the combination of Convolutional Neural Networks with the Stacking technique. The Stacking technique uses the results obtained in the first learning stage as input to the second learning stage of the prediction model. The proposed methods were evaluated in three databases (FMA, MagnaTagATune and Million Song Dataset). We evaluated the methods in terms of Accuracy, Area Under the Roc Curve, Precision Recall Curve and Hamming Loss. We also measured the training time of the methods. The results obtained by the proposed methods were satisfactory, since everyone was able to overcome the Baseline, in addition to a reduction in training time 71 f. : il. (algumas color.).