masterThesis
An investigation into the effects of label noise on dynamic selection algorithms
Registro en:
WALMSLEY, Felipe Nunes. An investigation into the effects of label noise on dynamic selection algorithms. 2020. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Pernambuco, Recife, 2020.
Autor
WALMSLEY, Felipe Nunes
Institución
Resumen
In the literature on classification problems, it is widely discussed how the presence of label noise can bring about severe degradation in performance. Several works have applied Prototype Selection techniques, Ensemble Methods, or both, in an attempt to alleviate this issue. Nevertheless, these methods are not always able to sufficiently counteract the effects of noise. In this work, we investigate the effects of noise on a particular class of Ensemble Methods, that of Dynamic Selection algorithms, and we are especially interested in the behavior of the Fire-DES++ algorithm, a state of the art algorithm which applies the ENN to algorithm to deal with the effects of noise and imbalance. We propose a method which employs multiple Dynamic Selection sets, based on the Bagging-IH algorithm, which we dub Multiple-Set Dynamic Selection (MSDS), in an attempt to supplant the ENN algorithm on the filtering step. We find that almost all methods based on Dynamic Selection are severely affected by the presence of label noise, with the exception of the KNORAU algorithm. We also find that our proposed method can alleviate the issues caused by noise in some specific scenarios. CAPES Na literatura de problemas de classificação, é amplamente discutido como a presença de ruído nos rótulos de classe pode acarretar grave degradação na performance. Vários trabalhos aplicam técnicas de Seleção de Protótipos, Métodos de Ensemble, ou ambos, em uma tentativa de aliviar esse problema. Não obstante, esses métodos nem sempre são capazes de contrabalançar os efeitos do ruído. Neste trabalho, nós investigamos o efeito do ruído em uma classe em particular de Métodos de Ensemble, a classe dos métodos de Seleção Dinâmica, e estamos particularmente interessados no comportamento do algoritmo Fire-DES++, um algoritmo estado da arte que aplica o método Edited Nearest Neighbors (ENN) para lidar com os efeitos de ruído e desbalanceamento. Nós propomos um método que emprega múltiplos conjuntos de Seleção Dinâmica, baseado no algoritmo Bagging-IH, que nós nomeamos Multiple-Set Dynamic Selection (MSDS), em uma tentativa de suplantar o algoritmo ENN no passo de filtragem. Nós observamos que quase todos os métodos baseados em Seleção Dinâmica são fortemente afetados pela presença de ruído, exceto o algoritmo KNORAU. Nós também observamos que, em alguns cenários específicos, o nosso método proposto pode amenizar os problemas causados pelo ruído.