Tesis
Detecção de genes sob seleção positiva em linhagens de Escherichia coli patogênicas para aves (APEC) e para humanos
Detection of genes under positive selection in Avian Pathogenic Escherichia coli (APEC) and humans pathogenic strains
Registro en:
Autor
Rojas, Thaís Cabrera Galvão, 1980-
Institución
Resumen
Orientador: Wanderley Dias da Silveira Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Biologia Resumo: A bactéria Escherichia coli coloniza o trato intestinal de aves e humanos, de maneira comensal sem causar processos infecciosos. No entanto alguns clones adquiriram fatores de virulência específicos, permitindo o desenvolvimento de diferentes doenças como infecção do trato urinário, diarréia e meningite em humanos e colibacilose em aves. As linhagens que causam doença em aves são tipicamente denominadas APEC (Avian Pathogenic Escherichia coli). Neste trabalho foram sequenciados e anotados os genomas de quatro linhagens APECs (SCI-07, SEPT362, S17 e O8)que, juntamente com mais nove genomas referentes a linhagens de Escherichia coli patogênicas para aves e patogênicas para humanos foram utilizados para a busca de genes sob seleção positiva. Os genes homólogos foram agrupados,e posteriormente submetidos ao alinhamento de códons e das sequencias protéicas correspondentes. Uma árvore filogenética foi gerada para cada grupo de proteínas homólogas. Testes estatísticos determinaram qual entre os modelos de seleção neutra ou seleção positiva melhor explicou os dados existentes (alinhamentos de códons e árvores filogenéticas). Essas análises detectaram duzentas e cinquenta e quatro grupos de genes homólogos com evidência de seleção positiva. Para cada grupo foi realizado um teste de recombinação para verificar se o aumento na variação das sequencias não era devido à conversão gênica, resultando em cento e dezesseis grupos de genes homólogos sob seleção positiva. A proteína correspondente a um gene de cada grupo de genes homólogos foi identificada, por meio da ferramenta Blast. Diversos fatores de virulência, já conhecidos, e proteínas regulatórias puderem ser detectados. Os genes sob seleção positiva, também foram submetidos à anotação considerando o termo GO (Gene Ontology),apenas da categoria processo biológico. Dos cento e dezesseis genes apenas cinquenta e sete puderam ser identificados por meio dessa metodologia. O resultado da classificação dos genes dentro da classe GO, considerando o terceiro nível hierárquico,mostrou que a maioria dos genes anotados (31) tinha relação com o metabolismo primário.As proteínas cuja identificação, por meio do blast, não foi possível (proteínas hipotéticas)foram submetidas à análise de predição de localização subcelular e de peptídeo sinal. Essas análises revelaram que três proteínas desconhecidas (hypothetical proteinECIAI39_1028, hypothetical proteinZ0639e hypothetical proteinEC042_3791) são potenciais alvos para estudos que visam à busca de novos fatores de virulência de Escherichia coli patogênicas Abstract: The bacterium Escherichia coli colonizesthe intestinal tract of birds and humans, in a commensal relationship without causing infection. However, some clones have acquired specific virulence factors allowing the development of various diseases such as urinary tract infection, diarrhea and meningitis in humans and colibacillosis in poultry. The strains that cause disease in birds are typically named APEC (Avian Pathogenic Escherichia coli). In this study we sequenced and annotated the genomes of four APECs strains (SCI-07, SEPT362, S17 and O8). These genomes and nine others avian pathogenic Escherichia coli and humans pathogenic strains genomes were used for studying genes under positive selection. The homologous genes were grouped and then subjected to codons and corresponding protein sequences alignment. A phylogenetic tree was generated for each group of homologous proteins. Statistical tests determined which among neutral or positive selection models best explains the existing data (codon alignments and phylogenetic trees). This analyzes detected two hundred fifty-four groups of homologous genes with positive selection evidence. For each group a recombination test was conducted to verify if the variation increase in the sequences was not due to gene conversion, resulting in one hundred and sixteen groups of homologous genes under positive selection. The protein corresponding to a gene of each group of homologous genes under positive selection was identified through Blast tool. Genes under positive selection were annotated considering the GO term (Gene Ontology), just for the biological process category. Only fifty-seven genes could be identified using this methodology. The gene classification within the GO classes, considering only the third hierarchical level showed that most of the annotated genes (31) were related with the primary metabolism. Proteins which blast identification was not possible (hypothetical proteins) were subjected to sub cellular localization and signal peptide prediction analyzes. These analyzes revealed that three unknown proteins (hypothetical protein ECIAI39_1028, hypothetical protein Z0639e hypothetical protein EC042_3791) are potential targets for studies, in order to search for new virulence factors of pathogenic Escherichia coli Doutorado Microbiologia Doutora em Genética e Biologia Molecular