Tesis
Promoting interoperability of biodiversity spreadsheets via purpose recognition = Promovendo interoperabilidade de planilhas de biodiversidade através do reconhecimento de propósito
Promovendo interoperabilidade de planilhas de biodiversidade através do reconhecimento de propósito
Registro en:
BERNARDO, Ivelize Rocha. Promoting interoperability of biodiversity spreadsheets via purpose recognition = Promovendo interoperabilidade de planilhas de biodiversidade através do reconhecimento de propósito. 2017. 1 recurso online (85 p.). Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação, Campinas, SP.
Autor
Bernardo, Ivelize Rocha, 1982-
Institución
Resumen
Orientador: André Santanchè Tese (doutorado) - Universidade Estadual de Campinas, Instituto de Computação Resumo: Há muitas iniciativas para tornar os dados disponíveis, acessíveis, interoperáveis e reutilizáveis no contexto da Biologia. Eles se baseiam na adesão a esquemas de referência, padrões comuns ou ontologias. No entanto, no domínio de biodiversidade, ainda é habitual que os biólogos produzam seus dados em formatos ad hoc e heterogêneos. A adesão a um padrão impõe aos biólogos o custo de reestruturação e anotação de seus dados. Esta pesquisa aborda esta questão com foco em planilhas eletrônicas. Ela contribui com uma técnica para produzir automaticamente anotações semânticas em dados extraídos de planilhas, explorando a forma como os atributos se organizam em seus esquemas para identificar seu propósito. Elementos do conjunto de dados resultante podem ser integrados, articulados e manipulados de acordo com o seu propósito, em uma abordagem incremental e exploratória, permitindo que os biólogos naveguem e interajam com uma rede interconectada de dados de biodiversidade Abstract: There are many initiatives to promote "intelligent openness" or "FAIR principles" of data, i.e., ways to turn data Findable, Accessible, Interoperable, and Reusable. They rely on a compliance with reference schemas, common standards or ontologies. However, in the biodiversity domain, it is still usual that biologists produce their data in ad hoc and heterogeneous formats. A compliance with a standard imposes on them an upfront cost of restructuring and annotating their data. This research addresses this scenario focusing on spreadsheets. It contributes with a technique to automatically produce semantic annotations in data extracted from spreadsheets, exploring the way that attributes are arranged in their schemas to infer their purpose. Elements of the resulting semantic dataset can be integrated, articulated and handled according to their purpose, in an incremental and exploratory approach, allowing biologists to navigate and interact with an interconnected network of biodiversity data Doutorado Ciência da Computação Doutora em Ciência da Computação 2012/16159-6 FAPESP