masterThesis
Redes bayesianas para inferência de redes regulatórias de genes
Registro en:
Bastos dos Santos, Gustavo; Silva Guimarães, Katia. Redes bayesianas para inferência de redes regulatórias de genes. 2005. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2005.
Autor
SANTOS, Gustavo Bastos dos
Institución
Resumen
Nos últimos anos, um grande volume de dados de várias espécies vem sendo obtido
através de novas técnicas criadas e aperfeiçoadas pela biologia. Entre elas, tecnologias
para medir as diferenças das expressões dos genes, através de concentrações de mRNA
(microarray), estão se tornando extremamente populares e seus custos estão diminuindo.
A inferência de redes regulatórias de genes a partir de dados de expressão gênica para
estudar o metabolismo dos organismos é um processo importante e faz surgir o desafio
de conectar os genes e seus produtos em vias metabólicas, circuitos e redes funcionais. O
conhecimento sobre redes regulatórias de genes pode fornecer informações valiosas para
tratamento de doenças, identificação de quais genes controlam e regulam eventos celulares
e descoberta de vias metabólicas mais complexas.
Uma rede regulatória de genes é um modelo que representa as regulações entre genes
usando um grafo direcionado, no qual os nós indicam os genes e uma aresta (Gene 1,
Gene 2) indica que o Gene 1 regula o Gene 2 (através de ativação ou repressão). Vários
métodos foram propostos no decorrer dos anos para inferir uma rede regulatória de genes a
partir de dados de microarray de DNA usando modelos matemáticos, tais como equações
diferenciais, redes Booleanas e redes Bayesianas.
Este trabalho apresenta o estudo do modelo de Rede Bayesiana e a implementação de
dois programas, um usando o modelo de Rede Bayesiana e o outro usando o modelo Rede
Bayesiana dinâmica, ambos com regressão não-paramétrica para inferir redes regulatórias
de genes a partir de dados de expressão gênica de microarray de DNA. O critério usado
para escolher as melhores redes foi o Bayesian Information Criterion (BIC), que é mais
simples do que outros critérios existentes, mas ainda assim, é uma abordagem eficiente.
Os resultados do trabalho foram comparados com os de trabalhos anteriores usando
dois conjuntos de dados: dados artificiais para inferir uma rede regulatória artificial de
genes; e dados reais de microarray do ciclo celular da levedura Saccharomyces cerevisiae
para inferir o ciclo do ácido tricarboxílico (TCA). Os experimentos com os dados artificiais
apresentaram bons resultados quando comparados com modelos anteriores, principalmente
quando informações a priori foram adicionadas. Os experimentos com dados
biológicos foram mais surpreendentes, pois a quantidade de amostras existentes era pequena
e, mesmo assim, os resultados obtidos foram tão bons quanto os resultados dos
modelos anteriormente propostos.
A inferência de redes de genes a partir de dados de microarray usando modelos matemáticos é um problema recente e difícil. Este trabalho apresenta um modelo relativamente
simples com resultados promissores, podendo ser estendido em trabalhos futuros