doctoralThesis
Ontology-based clustering in a Peer Data Management System
Registro en:
Eduardo Santos pires, Carlos; Carolina Brandão Salgado, Ana. Ontology-based clustering in a Peer Data Management System. 2009. Tese (Doutorado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2009.
Autor
Pires, Carlos Eduardo Santos
Institución
Resumen
Os Sistemas P2P de Gerenciamento de Dados (PDMS) são aplicações P2P
avançadas que permitem aos usuários consultar, de forma transparente, várias
fontes de dados distribuídas, heterogêneas e autônomas. Cada peer representa
uma fonte de dados e exporta seu esquema de dados completo ou apenas uma
parte dele. Tal esquema, denominado esquema exportado, representa os dados a
serem compartilhados com outros peers no sistema e é comumente descrito por
uma ontologia.
Os dois aspectos mais estudados sobre gerenciamento de dados em PDMS
estão relacionados com mapeamentos entre esquemas e processamento de
consultas. Estes aspectos podem ser melhorados se os peers estiverem
eficientemente dispostos na rede overlay de acordo com uma abordagem
baseada em semântica. Nesse contexto, a noção de comunidade semântica de
peers é bastante importante visto que permite aproximar logicamente peers com
interesses comuns sobre um tópico específico. Entretanto, devido ao
comportamento dinâmico dos peers, a criação e manutenção de comunidades
semânticas é um aspecto desafiador no estágio atual de desenvolvimento dos
PDMS.
O objetivo principal desta tese é propor um processo baseado em
semântica para agrupar, de modo incremental, peers semanticamente similares
que compõem comunidades em um PDMS. Nesse processo, os peers são
agrupados de acordo com o respectivo esquema exportado (uma ontologia) e
processos de gerenciamento de ontologias (por exemplo, matching e
sumarização) são utilizados para auxiliar a conexão dos peers. Uma arquitetura
de PDMS é proposta para facilitar a organização semântica dos peers na rede
overlay. Para obter a similaridade semântica entre duas ontologias de peers,
propomos uma medida de similaridade global como saída de um processo de
ontology matching. Para otimizar o matching entre ontologias, um processo
automático para sumarização de ontologias também é proposto. Um simulador
foi desenvolvido de acordo com a arquitetura do PDMS. Os processos de
gerenciamento de ontologias propostos também foram desenvolvidos e incluídos no simulador. Experimentações de cada processo no contexto do
PDMS assim como os resultados obtidos a partir dos experimentos são apresentadas Faculdade de Amparo à Ciência e Tecnologia do Estado de Pernambuco