masterThesis
Uso de Meta-aprendizado para a Seleção e Ordenação de Algoritmos de Agrupamento Aplicados a Dados de Expressão Gênica
Registro en:
Gabriel Ferreira Soares, Rodrigo; Bernarda Ludermir, Teresa. Uso de Meta-aprendizado para a Seleção e Ordenação de Algoritmos de Agrupamento Aplicados a Dados de Expressão Gênica. 2008. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2008.
Autor
SOARES, Rodrigo Gabriel Ferreira
Institución
Resumen
O volume de dados de expressão gênica vem crescendo exponencialmente nos ultimos
anos devido as novas tecnologias da Biologia Molecular, que permitem medir a expressão
de milhares de genes ao mesmo tempo. A analise computacional desses dados tem grande
importância na Biologia e na Medicina. Ela permite, por exemplo, a descoberta de novas
classes de câncer biologicamente e clinicamente significantes e a identificação de novas
funções dos genes. As tecnicas de Aprendizado de Maquina não-supervisionado fazem
parte da metodologia de analise usada pelos especialistas. Existem diversos algoritmos
de agrupamento de dados, cada um procurando particionar os dados de uma maneira
especifica. A escolha desse algoritmo e fundamental para a qualidade do agrupamento
e, portanto, para a analise adequada dos resultados. Propomos uma metodologia de
meta-aprendizado para a escolha dos algoritmos de agrupamento de dados no contexto de
dados de expressão gênica de celulas cancergenas. Ate o momento, o meta-aprendizado
vinha sendo utilizado apenas no contexto supervisionado. Nesta Dissertação, estendemos
esse conceito para problemas não-supervisionados. Usamos bases de dados de diferentes
experimentos com microarrays de varios estudos sobre câncer. Extraimos caracteristicas
relevantes de cada base de dados a fim de emprega-las no aprendizado de Redes Neurais, k-
Vizinhos Mais Proximos e Maquinas de Vetores Suporte, utilizados como meta-aprendizes.
Esses metodos foram usados como sistemas de aprendizado para predizer a ordem de
desempenho dos algoritmos de agrupamento, bem como selecionar o melhor algoritmo, de
acordo com essas caracteristicas. Realizamos um conjunto de experimentos para validar
o uso de cada meta-aprendiz. Nesse contexto, mostramos que, em media, os rankings
sugeridos pelas Maquinas de Vetores Suporte são significativamente mais correlacionados
com o ranking ideal do que aqueles obtidos com o ranking default. Conseguimos realizar
um estudo inovador que pode ser expandido para dados de outros contextos, servindo
como ponto de partida para novas abordagens Conselho Nacional de Desenvolvimento Científico e Tecnológico