Trabalho de Conclusão de Curso
Análise sobre a predominância genética na anotação de um organismo
Registro en:
LOPES, Willian Apolinário. Análise sobre a predominância genética na anotação de um organismo. 2017. 54 f. Trabalho de Conclusão de Curso (Graduação em Sistemas de Informação) - Universidade Federal de Uberlândia, Uberlândia, 2017
Autor
Lopes, Willian Apolinário
Institución
Resumen
UFU - Universidade Federal de Uberlândia Trabalho de Conclusão de Curso (Graduação) A anotação é a primeira tarefa executada ao término da montagem de um genoma. De posse da sequência
completa ou parcial de bases nitrogenadas de um organismo a anotação consiste em nomear
funcionalmente cada uma das janelas abertas de leitura ou Open Reading Frame (ORF). A anotação
utiliza-se de conhecimento sobre genes de outros organismos, preferencialmente de organismos
evolutivamente próximos, para nomear ORFs desconhecidas. A decisão sobre qual gene será o
responsável por nomear uma ORF de organismos com sequências gênicas recém-montadas é baseada com
maior frequência na similaridade entre sequências proteicas, visto que a similaridade da sequência de
DNA dificilmente é conservada mesmo entre organismos evolutivamente próximos. Uma vez anotado um
genoma, passamos à fase seguinte no entendimento, por exemplo, dos mecanismos moleculares que levam
um organismo a causar uma patogenia. Entretanto, essa análise depende de uma anotação funcional de
qualidade para que se possa tirar conclusões corretas sobre o modo de vida e infecção de um organismo
patogênico. A necessidade de uma anotação de qualidade entre genomas evolutivamente próximos gerou
a ferramenta PANNOTATOR, ferramenta que foi melhorada nesse trabalho de conclusão de curso. Na
concepção do PANNOTATOR foi utilizada transferência de anotação funcional gênica, possuindo como
origem um genoma completo e com qualidade de anotação que fosse evolutivamente próximo de um
genoma de destino. Esse genoma foi denominado como mandatório. A transferência de anotação
funcional partindo apenas de um genoma de origem mostrou-se mais eficiente do que o padrão antes
utilizado de transferências que tinham como origem todos os genomas conhecidos. O motivo é a garantia
de continuidade da qualidade de anotação, caso a origem possua tal qualidade.
Nesse trabalho de conclusão de curso o PANNOTATOR foi melhorado para poder incorporar a
possibilidade de realizar a anotação funcional de genomas utilizando um segundo genoma como origem
ou o genoma opcional de origem. Essa funcionalidade surgiu da demanda de especialistas em anotação ao
levantarem a hipótese que um determinado genoma sob estudo estava sobre forte influência evolutiva de
outros dois genomas. Para avaliar essa hipótese o PANNOTATOR foi alterado para receber
opcionalmente um segundo genoma de origem de anotações funcionais e o PANNOTATOR deveria
utilizar ambos para gerar uma anotação em um genoma recém-montado ou genoma de destino. Além
disso, foi necessário realizar um teste estatístico para avaliar se determinados intervalos do genoma de
destino foram mais influenciados pelo genoma mandatório ou pelo genoma opcional. O teste do Qui
quadrado foi utilizado para definir se existia ou não diferença significativa entre as médias de genes
anotados por ambos os genomas de origem em intervalos de tamanhos fixos no genoma de destino. Essa
análise foi repetida variando-se os intervalos de tamanho no genoma de destino sob análise para 5 mil, 7.5 mil e 10 mil bases com valores de similaridade entre proteínas (cutoff) de 50, 75 e 95% resultando em nove cenários para análises.
Para o caso específico do genoma de destino e seus dois genomas de origem (mandatório e opcional) essa
análise não evidenciou regiões de maior predominância do genoma opcional. Esse resultado não
corrobora a hipótese levantada pelos especialistas em montagem e análise do Corinebacterium
pseudotuberculosis que o genoma opcional (linhagem 258) era evolutivamente determinante para o
genoma de destino assim como o genoma mandatório (linhagem 316), ambas de uma bactéria que infecta
eqüinos. Entretanto, essa análise proporcionou uma oportunidade de melhoramento do PANNOTATOR
que agora possui meios de inferir estatisticamente a importância evolutiva entre dois genomas de origem
para um genoma sob estudo. Essa análise pode ser feita considerando como intervalo de influência o
genoma de destino como um todo ou intervalos menores customizáveis pelo usuário do PANNOTATOR.
Tal recurso é inédito dentre ferramentas de anotação atuais e abre possibilidades para a elaboração de um
artigo revisado por pares em revistas internacionais lançando a versão 2.0 do PANNOTATOR.