Tesis
Tópicos em regularização com uma aplicação em Seleção Genômica
Date
2019-09-16Registration in:
SOUSA, Pedro Henrique Toledo de Oliveira. Tópicos em regularização com uma aplicação em Seleção Genômica. 2019. 95 f., il. Dissertação (Mestrado em Estatística)—Universidade de Brasília, Brasília, 2019.
Author
Sousa, Pedro Henrique Toledo de Oliveira
Institutions
Abstract
Os métodos de regularização foram desenvolvidos para contornar problemas de
overfitting e são amplamente utilizados em modelagens preditivas. Neste trabalho
realiza-se uma breve introdução sobre a álgebra de matrizes relacionada a tais
métodos, com ênfase nas inversas generalizadas, no posto e nas possíveis dimensões
dessas matrizes, bem como apresentar uma solução geral, para sistemas lineares
consistentes e inconsistentes. Em seguida, as decomposições de matrizes SVD
(Singular Value Decomposition) e GSVD (Generalized Singular Value Decomposition)
são utilizadas para a implementação dos modelos de regularização Tikhonov e
TSVD e, posteriormente, analisa-se outros dois métodos de regularização (LASSO
e LASSO Bayesiano), que estimam os coeficientes e simultaneamente realizam a seleção
de variáveis. Como aplicação, realiza-se uma avaliação da qualidade preditiva
dos modelos de regularização no contexto de Seleção Genômica em dados genéticos
superdimensionados e de alta complexidade. Os referidos dados caracterizam-se por
conter informações do DNA (genótipos) de plantas de eucalipto e a finalidade da
análise é desenvolver uma abordagem alternativa aos programas de melhoramento
genético tradicionais. Em resumo, os resultados mostram que os modelos para fenótipos
com maior herdabilidade apresentam medidas de previsão superiores. Por
fim, os métodos que conduzem a seleção de variáveis se mostraram superioridade
nas tarefas preditivas em todos os casos avaliados.