Dissertation
Uso de ferramentas de bioinformática para estudos de epidemiologia molecular, filogeografia e filodinâmica viral
Registro en:
SANTOS, L. A. Uso de ferramentas de bioinformática para estudos de epidemiologia molecular, filogeografia e filodinâmica viral. 2010, 140 f. Dissertação (Mestrado em Biotecnologia em Saúde e Medicina Investigativa) -Fundação Oswaldo Cruz, Centro de Pesquisas Gonçalo Moniz, Salvador, 2010.
Autor
Santos, Luciane Amorim
Resumen
As ferramentas de bioinformática tem sido amplamente utilizada para o melhor
entendimento de diversos microorganismos. Neste trabalho foram realizados três estudos
utilizando estas ferramentas para avaliar diferentes questões biológicas. No primeiro
estudo realizou-se uma caracterização molecular de 57 sequências do gene pol,
provenientes de pacientes infectados pelo HIV-1 de Salvador, Bahia, Brasil. Para
identificar os subtipos e formas recombinantes do HIV-1 circulante na cidade de Salvador
foi realizado análises filogenéticas, e através do algoritmo do banco de dados Stanford
HIV resistance as mutações associadas à resistência aos ARVs foram detectadas. Entre as
57 sequências analisadas foram identificados neste estudo 45 (77,2%) pertencem ao
subtipo B, 11 (21,0%) recombinantes BF e uma (1,8%) do subtipo F1. Além disto, uma
alta frequência de eventos de recombinação entre os subtipos B e F foram detectados com
5 padrões de recombinação, duas intergênicas e três intragênicas, mostrando uma alta
diversidade. As mutações encontradas com uma maior prevalência foram: I54V (PI) em
7,0%; M184V (NRTI) em 14,0% e K103N (NNRTI) em 10,5% das sequências
analisadas. Estes resultados contribuem para traçar o perfil da epidemiologia molecular e
diversidade do HIV-1 em Salvador. O segundo estudo avaliou a filodinâmica do HIV-1
em pares de mãe e filho infectados, e em diferentes fases da infecção, três pares na fase
aguda e um na fase crônica, e que apresentavam sequências de diferentes tempos. Para
este fim foi realizado inferências filogenéticas bayesianas, onde a hipótese do relógio
molecular e de diferentes crescimentos populacional foram testadas. Não foi possível
observar uma diferença entre a dinâmica da população viral da mãe e a encontrada no
filho. Porém, quando observamos o crescimento populacional e o tamanho da população
efetiva, ao longo do tempo, sequências provenientes de pares em fase crônica da infecção
tem um crescimento mais constante, enquanto as sequências dos pares na fase aguda da
infecção se observa uma dinâmica das populações virais, provavelmente devido à pressão
do sistema imune e a não adaptação destes vírus. No terceiro estudo, 104 sequências do
genoma completo do WNV, disponíveis no Genebank, foram estudadas para identificar a
região genômica que apresenta máximo poder interpretativo para inferir relações
temporais e geográficas entre as cepas do vírus. Alinhamentos de cada gene foram
submetidos à avaliação do sinal filogenético através do programa TREEPUZZEL. As
regiões NS3 e NS4 apresentaram um sinal filogenético acima de 70%, sendo as regiões
mais indicadas para construção filogenética. Além disto, árvores bayesianas foram
inferidas utilizando as regiões NS3, NS5 e E, onde os clados das árvores NS3 e NS5
apresentaram um maior suporte e estrutural temporal geográfica, diferente da região E.
Estes achados mostram que os genes NS3 e NS5 são os mais indicados para análises
filogenéticas. Neste trabalho foi demonstrando o uso de ferramentas de bioinformática
para a melhor caracterização da diversidade, epidemiologia molecular, dinâmica
populacional e determinação das relações temporal e geográfica dos vírus. The bioinformatics tools have been widely used for better understanding of several
microorganisms. Here three studies were performed using these tools to answer different
biological questions. In the first study, it was conducted the molecular characterization of
57 HIV-1 pol gene sequences from infected patients from Salvador, Bahia, Brazil. To
identify the HIV-1 subtypes and recombinants forms, phylogenetics analyses were
performed and the Stanford HIV resistance Database were used to analyze the
antiretroviral susceptibility. Among all analyzed sequences, 45 of them were (77.2%)
subtype B, 11 (21.0%) were BF recombinant and one sequence was (1.8%) subtype F1.
Furthermore, a high frequency of recombination events between subtypes B and F was
detected with five different patterns: two intergenic and three intragenic. The mutations
found with higher prevalence were: I54V (PI) in 7.0%; M184V (NRTI) in 14.0% and
K103N (NNRTI) in 10.5% of the analyzed sequences. These results contribute for the
knowledge of the molecular epidemiology and diversity of HIV-1 in Salvador. The
second study have evaluated the HIV-1 phylodynamics in mother and child infected pairs
in different stages of infections: three pairs acutely infected and one chronically infected.
Phylogenetic inference was performed using the Bayesian framework were the molecular
clock and different population growth models hypothesis were tested. We did not find
any difference of the population dynamics between mother and child. However, when
observing the population growth and the effective population size through time, the
chronically infected pair sequences showed a constant growth, while the acutely infected
pair sequences showed a more dynamic population growth, probably due to the immune
system selective pressure. In the third study, 104 WNV full genome sequences were
selected from Genbank, to identify the best genomic region, which could provide the
maximal interpretative power to infer temporal and geographic relationships among the
virus strains. The phylogenetic signal was evaluated using the TREEPUZZEL program.
The results showed that the NS3 and NS5 regions are the best ones to infer phylogeny
since their phylogenetic signal was higher than 70%. Furthermore, Bayesian trees were
constructed using the NS3, NS5 and E regions, and the NS3 and NS5 tree clades showed
a higher support and a temporal geographic structure, different from the E region. These
findings show that the NS3 and NS5 genes are the most informative genes for
phylogenetic analyses. These studies demonstrated the use of bioinformatics tools for the
better characterization of the virus diversity, molecular epidemiology, and population
dynamics.