Dissertation
Análise multi-ômica das vias associadas à tuberculose infantil
Fecha
2022Registro en:
ROCHA, Eduardo Fukutani. Análise multi-ômica das vias associadas à tuberculose infantil. 2022. 44f. Dissertação, (mestrado)-Instituto Gonçalo Moniz, Fundação Oswaldo Cruz, Salvador, 2022.
Autor
Rocha, Eduardo Fukutani
Institución
Resumen
INTRODUÇÃO: A tuberculose é uma das principais causas de mortalidade infantil relacionada a doenças infecciosas no mundo. Se trata de uma doença infecciosa que afeta principalmente os pulmões, causada pelo bacilo Mycobacterium Tuberculosis. Os métodos atuais para diagnosticar a TB infantil apresentam baixa performance. Assinaturas transcricionais e metabólicas para o diagnóstico da TB infantil são interessantes e promissoras, porém ainda precisam de mais validações para que o seu como testes de rotina seja possível. Assinaturas identificadas com integração de dados transcriptômicos e metabolômicos são uma alternativa promissora para o diagnóstico da TB infantil. OBJETIVO: O objetivo deste trabalho é identificar uma assinatura em dados transcriptômicos e metabolômicos integrados para classificar crianças portadoras de TB. MATERIAIS e MÉTODOS: Amostras de crianças de até 15 anos foram coletadas da cidade de Pune, do estado de Maharashtra, Índia. As amostras tiveram os seus metabólitos medidos por CL/EMAD e seus transcritos mensurados por NGS. No total, 40 amostras com dados transcriptômicos e metabolômicos foram obtidas, destas 16 são amostras do grupo caso (TB) e 24 são amostras controle. Os genes diferencialmente expressos entre os grupos caso e controle foram identificados nos dados transcriptômicos. O algoritmo de floresta aleatória foi utilizado para identificar os melhores genes classificadores entre os DEGs. A performance dos classificadores identificados foi avaliada por curvas ROC. Uma validação in silico da performance dos genes selecionados foi feita em outros conjuntos de dados. A integração dos dados transcriptômicos e metabolômicos foi realizada, para isso foi feita uma análise de correlação entre os genes selecionados e os valores de abundância dos metabólitos. Por fim, uma análise de enriquecimento de vias foi aplicada aos metabólitos correlacionados com os genes. As vias metabólicas enriquecidas foram estudadas e relacionadas à patologia da TB infantil. RESULTADOS: Os genes diferencialmente expressos foram analisados utilizando o pacote DESeq2, identificando 174 DEGs. O algoritmo de floresta aleatória foi aplicado nos dados de expressão dos DEGs, indicando 5 genes: BPI, AZU1, C1QC, AC092580.4 e MPO. Curvas ROC foram utilizadas para mensurar a performance dos DEGs e dos 5 genes, apresentando AUCs de 0,86 e 0,91 respectivamente. Um total de 27 metabólitos foram correlacionados aos 5 genes no grupo caso, enquanto 33 metabólitos foram correlacionados no grupo controle. As vias metabólicas enriquecidas condizem com o quadro observado na TB infantil. A performance dos genes selecionados foi validada em outros conjuntos de dados: GSE39939, GSE39940 e GSE41055. Para isto, curvas ROC mensuraram a performance dos genes na classificação de amostras dos outros conjuntos de dados. As principais AUCs nos outros conjuntos foram de 0,80 no GSE39939, 0,85 no GSE39940 e 0,70 no GSE41055. CONCLUSÃO: O conjunto de genes classificadores proposto é uma alternativa que demonstrou bastante consistência na sua performance, inclusive em outros conjuntos de dados. Este conjunto classificador é um passo à frente para a identificação de um conjunto de genes como potenciais biomarcadores para a TB infantil