Tese
Operador de recombinação para programação genética baseado em regressão linear múltipla
Recombination Operator for Genetic Programming based on Multiple Linear Regression
Registro en:
Autor
Marques, Leonardo
Institución
Resumen
Genetic Programming (GP) is a technique of Evolutionary Computation that evolves individuals of variable size and shape. The expressiveness in the representation makes GP a very useful tool in Engineering, producing competitive results with human intelligence. One of its most common applications is the automatic discovery of models from data analysis, which is known as Symbolic regression. The use of GP requires careful implementation of its genetic operators, especially recombination and mutation. Classical approaches to operator creation are often based on the syntactic characteristics of individuals, while recent techniques are directly or indirectly guided by semantics. There are also approaches that combine Regression Analysis and Evolutionary Computation for higher quality responses. In general, all these operators are subject to the same problem: the number of genes that make up individuals begins to increase wildly after a few generations without improvements in aptitude, compromising the quality of the responses produced. This phenomenon is called bloat effect. The objective of this work is to present a new operator for Genetic Programming that allows the evolution of populations that can present more accurate and structural individuals whose size is naturally controlled. The developed operator simultaneously acts on recombination and mutation, promoting variational inheritance and population diversity. By providing the production of high-quality individuals while evolving populations without the harmful effects associated with bloat, the developed operator proved to be superior to classical subtree recombination, to new genetic operators based on semantics, and also to other recent techniques based on Analysis of Regression. Tese (Doutorado) A Programação Genética (PG) é uma técnica de Computação Evolucionária que evolui indivíduos com genótipo de tamanho e formato variáveis. A expressividade na representação faz da PG uma ferramenta bastante útil na Engenharia, produzindo resultados competitivos com a inteligência humana. Uma de suas aplicações mais comuns é a descoberta automática de modelos a partir da análise de dados, o que é conhecido por Regressão Simbólica. A utilização da PG requer cuidadosa implementação de seus operadores genéticos, principalmente a recombinação e a mutação. Abordagens clássicas para a criação dos operadores costumam basear-se nas características sintáticas dos indivíduos, ao passo que técnicas recentes são direta ou indiretamente guiadas pela semântica. Há ainda abordagens que combinam Análise de Regressão e Computação Evolucionária para obter respostas com maior qualidade. De maneira geral, todos esses operadores estão sujeitos a um mesmo problema: a quantidade de genes que compõem os indivíduos começa a aumentar descontroladamente após algumas poucas gerações sem que haja melhorias na aptidão, comprometendo a qualidade das respostas produzidas. Este fenômeno é denominado efeito bloat. O objetivo deste trabalho é apresentar um novo operador para Programação Genética que possibilite evoluir populações que possam apresentar indivíduos mais acurados e de representação estrutural cujo tamanho seja naturalmente controlado. O operador desenvolvido simultaneamente atua na recombinação e na mutação, promovendo herança variacional e diversidade populacional. Por proporcionar a produção de indivíduos de alta qualidade enquanto evolui populações sem os efeitos nocivos associados ao bloat, o operador desenvolvido mostrou-se superior à clássica recombinação de subárvore, a novos operadores genéticos baseados em semântica e também a outras técnicas recentes baseadas em Análise de Regressão.