Comparação empírica de 16 algoritmos de regressão em 59 datasets
Empirical comparison of 16 regression algorithms on 59 datasets
dc.creator | Frondana, Giovani, 1981- | |
dc.date | 2017 | |
dc.date | 2017-03-16T00:00:00Z | |
dc.date | 2017-08-24T18:35:10Z | |
dc.date | 2017-08-24T18:35:10Z | |
dc.date.accessioned | 2018-03-29T05:28:19Z | |
dc.date.available | 2018-03-29T05:28:19Z | |
dc.identifier | FRONDANA, Giovani. Comparação empírica de 16 algoritmos de regressão em 59 datasets. 2017. 1 recurso online (63 p.). Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP. | |
dc.identifier | http://repositorio.unicamp.br/jspui/handle/REPOSIP/324331 | |
dc.identifier.uri | http://repositorioslatinoamericanos.uchile.cl/handle/2250/1358538 | |
dc.description | Orientador: Jacques Wainer | |
dc.description | Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação | |
dc.description | Resumo: Foram testados 16 algoritmos de regressão (random forest, support vector machine ¿ linear, polinomial e radial ¿, 1-hidden-layer neural network, gradient boosting machine, k-nearest neighbor, generalized linear model com regularização lasso ou elasticnet, multivariate adaptive regression splines, cubist, relevance vector machine, partial least squares, principal component regression, extreme learning machine, RBF network e gaussian process) em 59 datasets reais, com as métricas MAE e MSE. Os algoritmos foram comparados segundo os testes de Friedman com post-hoc Nemenyi e Wilcoxon corrigido por Hommel e por meio de análise bayesiana. Os resultados sugerem que o melhor algoritmo de regressão é o cubist, ainda que para fins práticos, em datasets muito grandes, a melhor opção seja o gradient boosting machine | |
dc.description | Abstract: We evaluated 16 regression algorithms (random forest, support vector machine ¿ linear, polynomial e radial ¿, 1-hidden-layer neural network, gradient boosting machine, k-nearest neighbor, generalized linear model with regularization lasso or elasticnet, multivariate adaptive regression splines, cubist, relevance vector machine, partial least squares, principal component regression, extreme learning machine, RBF network e gaussian process) on 59 real datasets with MAE and MSE metrics. For comparisons, we followed Friedman test with Nemenyi post-hoc, Wilcoxon corrected by Hommel procedure and Bayesian analysis. The results suggest that the best regression algorithm is cubist, although for practical purposes, in very large datasets, the best option is gradient boosting machine | |
dc.description | Mestrado | |
dc.description | Ciência da Computação | |
dc.description | Mestre em Ciência da Computação | |
dc.format | 1 recurso online (63 p.) : il., digital, arquivo PDF. | |
dc.format | application/pdf | |
dc.publisher | [s.n.] | |
dc.relation | Requisitos do sistema: Software para leitura de arquivo em PDF | |
dc.subject | Comparações múltiplas (Estatística) | |
dc.subject | Análise de regressão | |
dc.subject | Análise de algoritmos | |
dc.subject | Aprendizado de máquina | |
dc.subject | Multiple comparisons (Statistics) | |
dc.subject | Regression analysis | |
dc.subject | Algorithm analysis | |
dc.subject | Machine learning | |
dc.title | Comparação empírica de 16 algoritmos de regressão em 59 datasets | |
dc.title | Empirical comparison of 16 regression algorithms on 59 datasets | |
dc.type | Tesis |