masterThesis
Uma abordagem para avaliação da qualidade de linked datasets para aplicações de domínio específicos
Registro en:
Autor
SARINHO, Walter Travassos
Institución
Resumen
O crescimento da Web de Dados possibilita uma série de novas aplicações que podem
fazer uso de múltiplos Linked Datasets (fontes de dados publicadas segundo os princípios
Linked Data). O grande número de fontes de dados disponíveis na Web de Dados, bem
como a falta de informações sobre a proveniência e a qualidade destes dados, traz à tona
um grande desafio: como identificar os melhores Linked Datasets para uma determinada
aplicação? Uma possível solução é utilizar critérios de Qualidade da Informação (QI) no
processo de avaliação dos Linked Datasets, considerando os requisitos específicos da
aplicação. Neste cenário, esta dissertação propõe uma abordagem, denominada
QualityStamp, para avaliação da qualidade de Linked Datasets para aplicações de Domínio
Específico. A abordagem proposta utiliza cinco critérios de qualidade (disponibilidade,
tempo de resposta, atraso de fila, completude e interlinking) cujo objetivo é avaliar três
características dos Linked Datasets: (i) o desempenho, (ii) a capacidade de responder a um
conjunto de consultas e (iii) o grau de interligações de um dataset a outro. A avaliação de
qualidade é guiada pelos requisitos da aplicação, os quais são representados por meio de
um conjunto de consultas e dos requisitos não funcionais, que correspondem aos critérios
de qualidade mais indicados para a aplicação. Dessa forma, no momento da avaliação, um
especialista no domínio (ED) deverá escolher os critérios de qualidade que mais se
adequam à aplicação. Como resultado da avaliação, é gerada uma medida global de
qualidade cujo objetivo é prover uma classificação entre linked datasets os candidatos. Ao
longo do trabalho, a abordagem é apresentada e os experimentos para avaliação da mesma
são descritos. CAPES