Tesis
Estudo do Mobile-metagenome a partir de biblioteca metagenômica proveniente de solo com cultivo de cana-de-açúcar e solo de floresta
Fecha
2015-12-09Registro en:
PINTO, Alessandra dos Santos. Estudo do Mobile-metagenome a partir de biblioteca metagenômica proveniente de solo com cultivo de cana-de-açúcar e solo de floresta. 2015. ix, 69 p. Dissertação (mestrado) - Universidade Estadual Paulista Júlio de Mesquita Filho, Faculdade de Ciências Agrárias e Veterinárias de Jaboticabal, 2015.
000865029
33004102070P6
9429712259649346
Autor
Varani, Alessandro de Mello [UNESP]
Gomes, Elisângela Soares [UNESP]
Universidade Estadual Paulista (Unesp)
Institución
Resumen
Mobile Genetic Elements (MGE) are segments of DNA present in the biological domains that have the ability to move around within a genome. They are considered key player in the evolution and diversification of living things. Insertion Sequences (IS) are the most abundant MGEs of prokaryotes. IS are compact elements that encode the gene responsible for the mobilization, the transposase. Comparative genomic studies indicate that the transposase is the most abundant gene found in public database of genomes and metagenomes. This study evaluated the abundance and diversity of transposases from high-throughput sequencing data originated from two metagenomic libraries, one from soil with sugarcane cultivation and the other from forest soil. The metagenomes were analyzed through two research fronts. In the first one, transposases were identified in a set of 267. 879. 464 reads paired-end (2x100bp) by MG RAST tool. In the second front of research, the reads of each metagenome were fitted (de novo assembly) and subsequently recorded by ISsaga 2.0 tool and platform MG-RAST. The platform MG- RAST identified 902.982 (reads) with allocated transposase function, whereas the 2.0 ISsaga tool recovered 592 (scaffolds) containing open reading frames (ORFs) coding for transposase. A total of 120 (22%) scaffolds and 767.534 (85%) reads noted were classified in different taxonomic groups resulting the phylum Proteobacteria (48% - MG-RAST and 34.3% - Issaga 2.0). Comparative analysis and biocuration indicate that 695.296 (77%) of the reads were incorrectly assigned with transposase function by MG-RAST tool. Among the families of transposase classified by Issaga 2.0, feature the families: IS110 (76 / 13.9%), IS3 (74 / 13.6%), and particularly 65 scaffolds (11.9%) from ISNCY family (not classified yet). Another noticeable result is that no IS previously described in the literature has been identified in these metagenomic data. This study revealed: (a) MG-RAST ... Os Elementos Genéticos Móveis (EGMs) são segmentos de DNA presentes em todos os domínios, e que apresentam a capacidade de mobilização em um genoma. São considerados agentes chaves na evolução e diversificação dos seres vivos. Sequências de Inserção (IS) são os EGMs mais abundantes dos procariotos. IS são elementos compactos, que codificam o gene responsável pela mobilização, a transposase. Estudos de genômica comparativa indicam que a transposase é o gene mais abundante presente em banco de dados públicos de genomas e metagenomas. O presente estudo avaliou a abundância e diversidade de transposases a partir de dados de sequenciamento de alto rendimento provenientes de duas bibliotecas metagenômicas, a primeira originada de solo com cultivo de cana-de-açúcar e a segunda de solo de floresta. Os metagenomas foram analisados através de duas frentes de investigação. Na primeira frente de investigação foram identificadas as transposases em um conjunto de 267.879.464 reads paired-end (2x100bp) através da ferramenta MG-RAST. Na segunda frente de investigação, os reads de cada metagenoma foram montados (de novo assembly) e posteriormente anotados através da plataforma MG-RAST e da ferramenta ISsaga 2.0. A plataforma MG-RAST identificou 902.982 (reads) com função atribuída para transposases, enquanto que a ferramenta ISsaga 2.0 recuperou 592 (scaffolds) contendo quadros aberto de leitura (ORFs) codificando para transposases. Um total de 120 (22%) scaffolds e 767.534 (85%) reads anotados foram classificados em grupos taxonômicos distintos, onde o filo Proteobacteria (48% - MG-RAST e 34,3% - ISsaga 2.0) foi predominante. Análises comparativas e biocuração indicam que 695.296 (77%) dos reads foram incorretamente atribuídos com função transposase pela ferramenta MG-RAST. Dentre as famílias de transposases classificadas pelo ISsaga 2.0 destacam-se as famílias: IS110 (76/13,9%), IS3 (74/13,6%), e em particular...