Tesis
Avaliação de montadores de novo de RNA-Seq para análise de expressão diferencial de transcritos
Evaluation of de novo RNA-Seq assemblers in a differentially expressed transcripts analysis
Registro en:
CARVALHO, Lucas Miguel de. Avaliação de montadores de novo de RNA-Seq para análise de expressão diferencial de transcritos. 2015. 1 recurso online ( 123 p.). Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP.
Autor
Carvalho, Lucas Miguel de, 1991-
Institución
Resumen
Orientadores: Zanoni Dias, Felipe Rodrigues da Silva Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação Resumo: RNA-Seq é uma tecnologia desenvolvida a partir de dados de sequenciamento de nova geração (NGS) para estudos de transcriptomas. Um pesquisador pode reconstruir isoformas a partir de dados de RNA-Seq sem utilizar um genoma de referência (montagem de novo). Uma das diversas análises possíveis utilizando dados de RNA-Seq é encontrar genes ou transcritos diferencialmente expressos. O objetivo deste trabalho é avaliar metodologias de análises em larga escala aplicadas na área da transcriptômica para encontrar transcritos diferencialmente expressos, propondo um critério de classificação que maximize a chance da escolha de algum transcrito montado por um montador de novo ser diferencialmente expresso. Esse critério pode auxiliar a eliminar transcritos falsos positivos a serem analisados posteriormente em bancada por metodologias, como PCR Real Time (Polimerase Chain Reaction Real Time). Dados reais foram testados para validar as montagens de novo na procura de transcritos diferencialmente expressos e resultados mostram que na alteração do volume de dados, a quantidade de verdadeiros positivos (transcritos realmente diferencialmente expressos) se altera. Concluímos que o melhor montador de novo foi o Trinity Abstract: RNA-Seq is a next-generation sequencing data (NGS) technology developed for transcriptome studies. For an organism, a researcher can perform isoform reconstructions from RNA-Seq data without the reference genome (de novo assembly). One of the several possible analyses using RNA-Seq data is finding differentially expressed genes or transcripts. This study evaluates analytic methods used in large-scale transcriptome studies for finding differentially expressed transcripts, proposing a data classification criterium that maximizes the chance of choosing a differentially expressed transcript in a de novo assembly. This criterium helps eliminate false positives that hinder posterior methods, such as Real-Time PCR (Polymerase Chain Reaction Real Time). Real data were tested to evaluate de novo assemblies, searching for differentially expressed transcripts, and the results show that the amount of true positives (truly differentially expressed transcripts) varies with the data volume, favoring libraries with more data. We concluded that the best de novo assembler is Trinity Mestrado Ciência da Computação Mestre em Ciência da Computação 134480/9-2013 CNPQ