Trabalho de conclusão de graduação
Homo sapiens : análise de expressão gênica por transcriptograma
Autor
Benetti, Fernanda Pereira da Cruz
Resumen
O proteoma - o grupo de proteínas produzidas na célula - e suas interações formam uma rede complexa que determina o funcionamento e desenvolvimento celular. Devido a enorme quantidade de dados disponíveis, novas ferramentas são necessárias para organizar e identificar processos relevantes dentro do proteoma, permitindo uma análise de larga-escala (i.e. proteômica) em vez de pequena-escala (i.e. proteica). Neste trabalho, usamos um algoritmo de minimização de custo para organizar o proteoma humano e identificar módulos interativos, e mostramos que esses módulos podem ser compostos por proteínas de funções biológicas semelhantes. Finalmente, apresentamos o transcriptograma de células de tecido pulmonar humano normal e canceroso (adenocarcinoma). O transcriptograma mostra níveis de expressão gênica ao longo da rede ordenada, possibilitando a análise de larga-escala da dinâmica celular e tornando-o uma ferramenta poderosa de diagnóstico. Neste estudo, mostramos que ele pode ser usado para identificar módulos de proteínas que são expressas em níveis alterados em tecido normal e canceroso de fumantes e ex-fumantes, em comparação com tecido normal de não-fumantes. The proteome- the group of proteins produced in the cell - and their interactions form a complex network that determines the cell's functioning and development. Due to the enormous amount of data available, new methods and tools are needed to sort through and organize relevant processes within the proteome so as to allow a large-scale (i.e. proteomic) rather than small-scale (i.e. proteic) analysis. Here we use a cost-minimization algorithm to organize the human proteome and identify interactive modules, and show that these modules can be composed of proteins of similar biological functions. Finally, we present the transcriptogram of normal and cancerous (adenocarcinoma) cells of human lung tissue. The transcriptogram shows the gene expression levels along the ordered network, thereby enabling the large-scale analysis of the cell's dynamics and making it a powerful tool for diagnosis. In this study, we show that it can be used to identify modules of proteins that are expressed at altered levels in both normal and cancerous tissue of smokers and ex-smokers, in comparison to normal tissue of non-smokers.