Tese
Selection indices and support vector machines in the selection of sugarcane families
Índices de seleção e máquinas vector de suporte na seleção de famílias de cana- de-açúcar
Registro en:
MUETANENE, Belo Afonso. Selection indices and support vector machines in the selection of sugarcane families. 2022. 33 f. Tese (Doutorado em Estatística Aplicada e Biometria) - Universidade Federal de Viçosa, Viçosa. 2022.
Autor
Muetanene, Belo Afonso
Institución
Resumen
The present study aimed to compare selection indices, namely: Smith and Hazel multiplicative, Mulamba and Mock's, and the support vector machines algorithm for sugarcane families selection. We used two datasets, from Moreira et al. (2021) and from Ferreira et al. (2022), both related to the sugarcane breeding program conducted at the Center for Sugar cane Research and Breeding at the Federal University of Viçosa, Oratórios, Minas Gerais. Both experiments were conducted in a randomized complete block design. We constructed the selection indices via mixed models approach. We adopted a selection percentage of 18% of the top families for the selection process. In both studies, we considered as explanatory traits: the number of stalks, stalks diameter and stalk height, and as the response trait the tons of stalks per hectare per family. In the dataset from Ferreira et al. (2022), the support vector machine was a better approach to select sugarcane families by learning from the data after multivariate simulation. Whereas in the dataset from Moreira et al. (2021), using similar methodology, lower performance for support vector machines was obtained. Keywords: Synthetic data. Indirect selection. Yield prediction. Machine learning. BLUP O presente estudo teve o objetivo de comparar índices de seleção, nomeadamente: índices de Smith e Hazel, multiplicativo e Mulamba e Mock com máquinas vector de suporte para a seleção de famílias de cana-de-açúcar. Foram usadas duas bases de dados, a de Moreira et al. (2021) e a de Ferreira et al. (2022), ambas relacionadas ao programa de melhoramento genético da cana-de-açúcar conduzido no Centro para a Pesquisa e Melhoramento Genético da cana-de-açúcar na Universidade Federal de Viçosa, Oratórios, Minas Gerais. Ambos os estudos foram conduzidos em delineamento de blocos completos. Os índices de seleção foram construídos via modelos mistos, sendo adotada uma percentagem de seleção de 18% das melhores famílias para a seleção. Em ambos os estudos, foram consideradas como variáveis explicativas: número de colmos, diâmetro do colmo e altura do colmo e como variável resposta o rendimento do colmo por hectare (toneladas/hectare). Na base de dados de Ferreira et al. (2022), as máquinas vector de suporte foram melhor método para selecionar famílias de cana-de-açúcar a partir da aprendizagem dos dados após simulação multivariada. Para os dados de Moreira et al. (2021), usando metodologia similar, pior desempenho para as máquinas vector de suporte foi observado. Palavras-chave: Dados sintéticos. Seleção indireta. Predição de rendimento. Aprendizagem de máquina. BLUP Coordenação de Aperfeiçoamento de Pessoal de Nível Superior