Dissertation
Representação multidimensional da Rede da Vida a partir de distâncias intergenômicas
Registro en:
MACHADO FILHO, Edson Silva. Representação multidimensional da Rede da Vida a partir de distâncias intergenômicas. 2017. 92 f. Dissertação (Mestrado em Biologia Computacional e Sistemas)-Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, RJ, 2017.
Autor
Machado Filho, Edson Silva
Resumen
Esta dissertação trata de métodos de cálculo de distâncias intergenômicas a partir do conjunto de proteínas preditas de organismos e da representação de distâncias intergenômicas em um modelo tridimensional da Rede da Vida. No presente trabalho é feita uma análise do método de cálculo de distâncias intergenômicas Genome Conservation e proposto um novo método, que aplica distância Jaccard aos dados de similaridade obtidos a partir de comparações de proteínas. O método proposto é capaz de inferir distâncias intergenômicas confiáveis, a partir de comparações unidirecionais de proteínas efetuadas no software SSEARCH, diminuindo a utilização extensiva e onerosa de recursos computacionais demandados pela abordagem tradicional de comparações bidirecionais. Adicionalmente, a partir da aplicação do método proposto, foram inferidas distâncias intergenômicas para 210 organismos de diferentes espécies dos três domínios da vida conhecidos, possibilitando a construção de modelo inicial de Rede da Vida. Aplicando um método matemático de escalonamento multidimensional não-métrico a Rede da Vida é apresentada em um modelo 3D. This dissertation deals with methods for calculating intergenomic distances from the set of predicted proteins of organisms and the representation of intergenomic distances in a three-dimensional model of the Network of Life. In this work we've done an analysis of the intergenomic distances method Genome Conservation and also a proposal of a new method, using Jaccard index and similarity scores of protein comparisons. The proposed method is able to infer reliable intergenomic distances, based on unidirectional comparisons of proteins done in the SSEARCH software, reducing the extensive and costly utilization of computational resources demanded by the traditional approach of bidirectional comparisons. Additionally, by applying the proposed method, intergenomic distances were obtained for 210 organisms of different species from the three kingdoms of life, allowing the construction of an initial model of the Network of Life. Applying a mathematical method of non-metric multidimensional scaling, the Life Network is presented in a 3D model. 2500-12-31