Tesis
BioGraph = linking biological bases across organisms = BioGraph: conectando bases biológicas de múltiplos organismos
BioGraph : conectando bases biológicas de múltiplos organismos
Registro en:
Autor
Borges, Luana Loubet, 1992-
Institución
Resumen
Orientador: André Santanchè Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação Resumo: A representação de dados como redes tem se mostrado uma poderosa abordagem para análises de dados em biodiversidade, e.g., interações entre organismos; relações entre genes e fenótipos etc. Neste contexto, bancos de dados e repositórios seguindo um modelo de grafo (e.g., RDF) têm sido cada vez mais utilizados para interconectar informações e para dar suporte a análises dirigidas a redes. Usualmente, este tipo de análise requer a coleta e ligação de dados advindos de várias fontes distintas e heterogêneas. Neste trabalho, nós investigamos este desafio no contexto de bases biológicas com foco na caracterização de organismos vivos, especialmente seus fenótipos e doenças. Isto inclui a rica diversidade de Model Organisms Database (MODs) -- repositórios especializados em um taxon particular -- amplamente usados em estudos médicos e biológicos. Nós exploramos uma abordagem de integração leve, inspirada na iniciativa de Linked Open Data, mapeando várias bases biológicas em um banco de dados de grafos unificado -- nosso BioGraph -- e interligando elementos-chave para oferecer uma perspectiva interconectada sobre os dados. Apresentamos aqui experimentos práticos para validar a proposta e para demonstrar como o BioGraph pode contribuir para análises de dados biológicos em uma ótica de redes Abstract: Representing data as networks have been shown to be a powerful approach for data analysis in biodiversity, e.g., interactions among organisms; relations among genes and phenotypes etc. In this context, databases and repositories following a graph model (e.g., RDF) have been increasingly used to interconnect information and to support network-driven analysis. Usually, this kind of analysis requires gathering together and linking data from several distinct and heterogeneous sources. In this work, we investigate this challenge in the context of biological bases focusing on the characterization of living organisms, especially their phenotypes and diseases. It includes the rich diversity of Model Organism Databases (MODs) -- repositories specialized in a particular taxon -- widely used in the biological and medical studies. We exploit a lightweight integration approach, inspired in the Linked Open Data initiative, mapping several biological bases in a unified graph database -- our BioGraph -- and linking key elements to offer an interconnected view over the data. We present here practical experiments to validate the proposal and to show how BioGraph can contribute for biological data analysis in a network perspective Mestrado Ciência da Computação Mestra em Ciência da Computação 01P-3501-2014 CAPES