dc.description.abstract | RESUMEN: En la actualidad, la identificación y clasificación automática de géneros musicales es una de las áreas de procesamiento de señales que ha tenido avances cualitativos y cuantitativos. En este contexto, múltiples sistemas de clasificación de géneros musicales han sido desarrollados, basados en características de tiempo frecuencia, así como en características con enfoque musical. Esto ha dado cabida a que organizaciones a nivel mundial busquen obtener sistemas de clasificación que ayuden a indexar y organizar contenido intangible que puedan poseer distintas naciones. Basado en lo anterior, se tiene el objetivo de realizar un sistema de identificación y clasificación que determine de manera precisa, los géneros musicales que son actualmente reconocidos en distintas regiones del mundo. Esto se logró con el análisis exhaustivo de múltiples métodos y algoritmos que permiten analizar contenido digital de archivos musicales, para obtener una descripción representativa computacional. Uno de los métodos implementados es el método de extracción de características MFCC, obteniendo la información de la envolvente de la señal de audio musical, como primer sistema de clasificación se utilizó el modelo SVM. Como solución y propuesta para el objetivo del trabajo se utilizaron técnicas de aprendizaje profundo, éstas han demostrado en los últimos años que pueden llegar a mejorar la detección correcta de géneros musicales. Además del desarrollo de este sistema de clasificación se incorporó otro método de extracción de características denominado BPM, éste obtiene aquellos pulsos dominantes presentes en la señal de audio musical; con esto se determina el tempo de una pista musical, por lo que es uno de los métodos de extracción elegidos para la elaboración del sistema propuesto para la clasificación de géneros musicales. Los primeros resultados obtenidos a partir del método MFCC presentan, en algunos géneros musicales, un 90% de precisión. Al unir el método BPM, se obtuvo un aumento en el porcentaje de precisión entre 2% y 4% en la identificación de algunos géneros musicales; mientras que en algunos otros se mantuvo la precisión. Para el desarrollo del sistema de clasificación con técnicas de aprendizaje profundo, se utilizaron redes neuronales profundas, empleando las Redes Neuronales Convolucionales. Los resultados alcanzados con el uso de estas técnicas de aprendizaje profundo fueron del 80% de precisión promedio de toda la base de datos de pruebas.
ABSTRACT: At present the identification and automatic classification of musical genres is one of the areas of signal processing that has had qualitative and quantitative advances. In this context, multiple classification systems of musical genres have been developed, based on time-frequency features, as well as features with a musical approach. This has encouraged for organizations worldwide to seek classification systems that help to index and organize, the intangible content that different nations may have. With this in mind, the aim is to create a classification system that helps determine precisely, musical genres that are currently recognized in different regions of the world. This was achieved with the exhaustive analysis of multiple methods and algorithms that enable the analysis of the digital content in musical files, and to obtain a representative computational description.
One of the implemented methods was the MFCC extraction method, obtaining the envelope of a musical audio, and as the first classification system a SVM model was used. As a solution and proposal in the purpose of this work, deep learning techniques were used, since currently these have shown to determine up to a 90% correct detection of musical genres. In addition to the implementation of this classification system, another feature extraction method called BPM was incorporated, unlike the MFCC method, it obtains those dominant pulses present in musical audio, with this the tempo of a musical track is determined, for that reason it is one of the extraction methods chosen for the elaboration of the proposed system for the classification of musical genres. The first obtained results have a 90% precision, in some musical genres. When introducing the BPM method, an increase in the accuracy percentage between 2% and 4% in the identification of some musical genres was obtained, while in the rest the accuracy is maintained compared to only implementing the MFCC method. For the development of the classification system with deep learning techniques, deep neural networks were used, using Convolutional Neural Networks. The results achieved with the use of these deep learning techniques were 80% average precision of the whole test database, this is explained more broadly in the thesis work. | |