Dissertation
Desenvolvimento de modelos estatísticos para ensaios fenotípicos automatizados de Schistosoma Mansoni adulto
Registro en:
VASCONCELLOS JÚNIOR, Fábio Jorge. Desenvolvimento de modelos estatísticos para ensaios fenotípicos automatizados de Schistosoma Mansoni adulto. 2019. 161 f. Dissertação (Mestrado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2019.
Autor
Vasconcellos Júnior, Fábio Jorge
Resumen
Dentre as doenças parasitárias, a esquistossomose é um grave mal que assola parte da população mais pobre. Por isso, a pesquisa por novas terapias farmacológicas contra o seu agente etiológico (os parasitas do gênero Schistosoma) é uma atividade de grande relevância social e econômica. Entretanto, está atualmente disponível, na prática, um único fármaco, que já enfrenta problemas contra cepas resistentes. A primeira etapa no processo de pesquisa e o desenvolvimento de fármacos consiste na identificação de compostos com atividade biológica (hits), cujo método comumente empregado é a triagem de uma biblioteca de compostos baseada no alvo ou baseada em fenótipo. Contra as parasitoses, a abordagem fenotípica é muito relevante, graças ao seu maior valor biológico (sistêmico), comparado a um ensaio bioquímico. Além disso, como sua moderna extensão, estão disponíveis métodos automatizados de triagem de alto conteúdo (HCS) em células ou em pequenos organismos. Uma das dificuldades desta abordagem está na insuficiência das ferramentas estatísticas mais difundidas na análise de dados de maior complexidade. Logo, faz-se necessário o desenvolvimento de modelos para uma análise estatística adequada aos dados complexos obtidos experimentalmente, a fim de estimar o efeito do composto no fenótipo do parasito. Desta forma, o objetivo do presente trabalho foi o desenvolvimento de modelos estatísticos para a análise do efeito de compostos candidatos antiesquistossomais, a partir de dados quantitativos de ensaios fenotípicos automatizados, obtidos em Schistosoma mansoni adulto com a tecnologia HCS na plataforma de Bioensaios e Triagem de Fármacos do IOC/FIOCRUZ A partir da análise estatística exploratória dos dados, pôde-se propor e comparar modelos para a inferência do efeito de cada composto testado, a partir de dados de motilidade do parasita. Foram avaliados modelos lineares generalizados multinível, em busca de adequação à estrutura hierárquica e longitudinal dos dados. Para tornar o modelo mais robusto, foram comparadas duas propostas de inclusão da informação de similaridade química entre os compostos, utilizando o conceito de espaço químico representado por uma rede. O modelo obtido desta forma foi adaptado para servir em tarefas de ajuste de curvas Dose-Resposta a dados longitudinais; e scripts em R foram construídos com o intuito de permitir a aplicação automatizada futura destes modelos. O melhor modelo univariado proposto neste trabalho foi aquele que assume uma distribuição Poisson Generalizada, onde efeitos aleatórios a nível de verme foram necessários para a construção de um modelo adequado aos dados. Em busca de estender a modelagem anterior para uma análise fenotípica mais ampla, foi realizada uma análise multivariada para testar um modelo preditivo de compostos hits, do tipo árvore de regressão com efeitos aleatórios. Com base em uma análise exploratória inicial, foi feita a transformação e redução de dimensionalidade dos dados. Avaliou-se a possibilidade de discriminar fenótipos diferentes por meio de agrupamento fuzzy dos dados disponíveis. Entretanto, foi possível discriminar apenas dois clusters nesta etapa de agrupamento. Among the parasitic diseases, schistosomiasis is a serious disease that afflicts part of the poorest population. Therefore, the search for new pharmacological therapies against its etiologic agent (the parasites of the genus Schistosoma) is an activity of great social and economic relevance. However, a single drug, which already faces problems against resistant
strains, is currently available in practice. The first step in the research and drug development process is the identification of compounds with therapeutic activity (hits), whose commonly used method is the screening of a library of compounds based on the target or based on phenotype. Against parasitic diseases, the phenotypic approach is very relevant, thanks to its greater biological value (systemic), compared to a biochemical test. In addition, as its modern extension, automated high-content screening (HCS) methods are available in cells or in small organisms. One of the difficulties of this approach lies in the insufficiency of the most widespread statistical tools in the analysis of more complex data. Therefore, it is necessary to develop models for a statistical analysis appropriate to the complex data obtained
experimentally, in order to estimate the effect of the compound on the phenotype of the parasite. Thus, the objective of the present work was the development of statistical models to analyze the effect of antischistosomal candidate compounds from quantitative data from automated phenotypic assays obtained in adult Schistosoma mansoni with HCS technology in Bioensaios e Triagem de Fármacos platform of IOC/FIOCRUZ. From the exploratory statistical analysis of the data was possible to propose and compare models for the inference of the effect of each compound tested, from parasite motility data. Multilevel Generalized linear models were evaluated, in order to match the hierarchical and longitudinal structure of
the data. In order to make the model more robust, two proposals were compared for the inclusion of chemical similarity information among the compounds, using the concept of chemical space represented by a network. The model obtained in this way was adapted to serve in tasks of adjustment of Dose-Response curves to longitudinal data; and R-scripts were built to allow the future automated application of these models. The best univariate model proposed in this work was one that assumes a Generalized Poisson distribution, in which random effects at the worm level were necessary to specify a suitable model to the data. In order to extend the previous modeling to a broader phenotypic analysis, a multivariate analysis was performed to test a regression tree predictive model with random effects to find hits compounds. Based on an initial exploratory analysis, the transformation and reduction of dimensionality of the data was done. The possibility of discriminating different phenotypes was evaluated through fuzzy clustering of the available data. However, it was possible to discriminate only two clusters in this clustering phase.