dissertação
Classificação de dados sensoriais de cafés especiais com resposta multiclasse via Algoritmo Boosting e Bagging
Classification of sensory data special coffees with answer multiclass through Algorithm Boosting and Bagging
Registro en:
OLIVEIRA, L. M. de. Classificação de dados sensoriais de cafés especiais com resposta multiclasse via Algoritmo Boosting e Bagging. 2016. 85 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária)-Universidade Federal de Lavras, Lavras, 2016.
Autor
Oliveira, Lílian Maria de
Institución
Resumen
Automatic classification methods have been developed in machine learning area in order to facilitate the categorization of data. Among the most successful methods include the Boosting and Bagging. The Bagging works by combining
classifiers adjusted in bootstrap samples of the data and the Boosting works by
applying sequentially an algorithm to rank the reweighted versions of the set of
training data, giving greater weight to the observations misclassified in the previous step. These classifiers are characterized by providing satisfactory results, low
computational cost and benefit of implementation simplicity. Given these characteristics, comes an interest in checking the performance of these automated methods
compared with traditional existing classification methods in Statistics, Linear Discriminate Analysis and Quadratic. In order to compare these techniques it was
used misclassification rates and accuracy of the models. To improve confidence in
the use of Boosting and Bagging methods in more complex problems of classification, a study was carried out by applying these techniques in real and simulated
data composed of more than two categories in the response variable. In this dissertation, to encourage the implementation of Boosting and Bagging was held in an
application Sensory Analysis. We conclude that automatic methods have a good
classification performance by providing lower error rates than Discriminant Linear
analysis and Quadratic Discriminant analysis in the tested applications. Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) Os métodos automáticos de classificação têm sido desenvolvidos na área
de Aprendizado de Máquina com o intuito de facilitar a categorização de dados.
Dentre os métodos mais bem sucedidos destacam-se o Boosting e o Bagging. O
Bagging funciona combinando classificadores ajustados em amostras bootstrap
dos dados e o Boosting funciona aplicando-se sequencialmente um algoritmo de
classificação a versões reponderadas do conjunto de dados de treinamento, dando
maior peso às observações classificadas erroneamente no passo anterior. Esses
classificadores se caracterizam por produzirem resultados satisfatórios, baixo custo
computacional e vantagem da simplicidade de implementação. Dadas essas características, surge um interesse em verificar o desempenho desses métodos automáticos comparados com os métodos clássicos de classificação existentes na Estatística, a Análise Discriminante Linear e Quadrática. Com o propósito de comparar
essas técnicas, utilizou-se as taxas de erro de classificação dos modelos. Para melhorar a confiança da utilização dos métodos Boosting e Bagging em problemas
mais complexos de classificação, um estudo foi realizado aplicando essas técnicas em dados reais e simulados que eram compostos por mais que duas categorias
na variável resposta. Nesta dissertação, para estimular a implementação do Boosting e Bagging, realizou-se uma aplicação na Análise Sensorial. Concluiu-se que
os métodos automáticos tiverem um bom desempenho de classificação, proporcionando taxas de erro menores que as Análises Discriminante Linear e Quadrática
nas aplicações testadas.