dc.contributorFerreira, Clécio da Silva
dc.contributorhttp://lattes.cnpq.br/7842524715253287
dc.contributorFerreira, Clécio da Silva
dc.contributorhttp://lattes.cnpq.br/7842524715253287
dc.contributorZeller, Camila Borelli
dc.contributorhttp://lattes.cnpq.br/6671405481844657
dc.contributorMagalhães, Tiago Maia
dc.contributorhttp://lattes.cnpq.br/7953363504273397
dc.creatorPenna, Isabela Lopes
dc.date2021-05-24T19:59:14Z
dc.date2021-03-18
dc.date2021-05-24T19:59:14Z
dc.date2021-03-17
dc.date.accessioned2023-09-29T15:03:12Z
dc.date.available2023-09-29T15:03:12Z
dc.identifierhttps://repositorio.ufjf.br/jspui/handle/ufjf/12727
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/9123969
dc.descriptionIn many cases, it is necessary to deal with databases with a large number of variables, bases called Big Data. In some situations it is necessary to reduce the number of these variables, either to have a model with only the significant variables or to solve problems such as multicollinearity. With this, several methods have emerged to solve the above cases. This work proposed to study the different selection methods in multiple linear regression models, such as methods of selecting subsets of variables, methods of regularization and methods of dimensionality reduction. Cross-validation procedures were used in the regularization processes for selecting the models. Real data applications were performed using the R Core Team software (2018).
dc.descriptionEm diversos casos é preciso lidar com bases de dados com um grande número de variáveis, bases essas denominadas Big Data. Em algumas situações se faz necessário reduzir o número dessas variáveis, seja para se ter um modelo apenas com as variáveis significativas ou para sanar problemas como multicolinearidade. Com isso surgiram vários métodos para solucionar os casos acima. Esse trabalho se propôs a estudar os diferentes métodos de seleção em modelos de regressão linear múltipla, como métodos de seleção de subconjuntos de variáveis, métodos de regularização e métodos de redução de dimensionalidade. Procedimentos de validação cruzada foram utilizados nos processos de regularização para seleção dos modelos. Aplicações em dados reais foram realizadas utilizando o software R Core Team (2018).
dc.formatapplication/pdf
dc.languagepor
dc.publisherUniversidade Federal de Juiz de Fora (UFJF)
dc.publisherBrasil
dc.publisherICE – Instituto de Ciências Exatas
dc.publisherUFJF
dc.rightsAcesso Aberto
dc.rightshttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subjectSeleção de Variáveis Regressoras
dc.subjectSelection of Regressor Variables
dc.subjectMínimos Quadrados Parciais
dc.subjectRidge Regression
dc.subjectRegressão Ridge
dc.subjectLASSO Regression
dc.subjectRegressão LASSO
dc.subjectRegressão de Componentes Principais
dc.subjectPartial Least Squares
dc.subjectPrincipal Component Regression
dc.subjectCNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
dc.titleSeleção de modelos de regressão linear em bases de alta dimensão
dc.typeTrabalho de Conclusão de Curso


Este ítem pertenece a la siguiente institución