Dissertação
Classificação de alto nível baseada em redes complexas para aprendizado multirrótulo
High-level classification based on complex networks for multi-label learning
Registro en:
Autor
Resende, Vinícius Henrique
Institución
Resumen
Data classification is one of the most important topics in machine learning (ML) and
aims to automate discrete learning tasks by assigning a class (or label) that characterizes
each instance of the problem addressed. Traditional classification algorithms (or
single-label) assume that each instance is associated with a single class, however, many
real-world problems can be related to multiple labels simultaneously, such as the image
annotation with multiple objects. As it is an extension of the single-label classification,
most of the multi-label learning algorithms (MLL) are based on traditional classification
techniques, inheriting their advantages but also their limitations. In relation to the limitations,
most single-label classification techniques have a learning process guided only
by physical characteristics of the data (e.g., distance or distribution) and ignore semantic
and structural relationships of the data, such as pattern formation. Recently, several researches
on ML have employed concepts of complex networks in order to capture structural
and topological relationships of the data (i.e., high-level characteristics) and consequently
improve their results. Inspired by the emerging usage of complex networks in ML, this
dissertation investigates new methods based on complex networks for MLL, presenting
new techniques for modeling the multi-label problem into a network as well as a new
hybrid approach able to consider both physical and topological aspects of the data by
combining complex networks with traditional MLL techniques. Experiments performed
on artificial and real-world databases demonstrate the ability of the high-level technique to
detect multiple patterns in the data and, as a result, improve the predictive performance
of traditional MLL techniques. Moreover, this work paves a way to new developments
based on complex networks to MLL. CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior Dissertação (Mestrado) A classificação de dados é um dos tópicos mais importantes de aprendizado de máquina (AM) e tem como objetivo automatizar problemas de categorização ou predição, atribuindo uma classe (ou rótulo) que caracteriza cada instância do problema abordado. Os algoritmos de classificação tradicionais (ou monorrótulo) assumem que cada instância é associada a uma única classe, entretanto, muitos problemas do mundo real podem ser relacionados a múltiplos rótulos simultaneamente, como por exemplo, a anotação de imagens contendo múltiplos objetos. Por se tratar de uma extensão da classificação monorrótulo, a maioria dos algoritmos de aprendizado multirrótulo (AMR) são baseados em técnicas da classificação tradicional, herdando suas vantagens mas também suas limitações. Em relação às limitações, a maioria das técnicas de classificação monorrótulo possuem o processo de aprendizado guiado apenas por características físicas dos dados (e.g., distância ou distribuição) e ignoram relacionamentos semânticos e estruturais dos dados, como por exemplo, formação de padrão. Recentemente, diversos trabalhos têm utilizado conceitos de redes complexas a fim de capturar relacionamentos estruturais e topológicos dos dados (i.e., características de alto nível) e consequentemente melhorar seus resultados. Inspirado pelo uso emergente de redes complexas no AM, este trabalho investiga um novo método baseado em redes complexas para o AMR, trazendo novas técnicas de modelagem do problema multirrótulo para a forma de rede, além de uma abordagem híbrida capaz de considerar tanto aspectos físicos quanto topológicos dos dados ao combinar redes complexas com técnicas de AMR tradicional. Experimentos realizados em bases de dados artificiais e reais demonstram a capacidade da técnica de alto nível em detectar múltiplos padrões nos dados e em virtude disso aprimorar a habilidade preditiva das técnicas de AMR tradicionais. Mais importante, este trabalho abre caminho para novas pesquisas sobre redes complexas para AMR.