doctoralThesis
Uma plataforma para suporte às bibliotecas digitais de eventos científicos com foco na extração de informação
Registro en:
ALVES, Neide Ferreira. Uma plataforma para suporte às bibliotecas digitais de eventos científicos com foco na extração de informação. Recife, 2013. 120 f. Tese (doutorado) - UFPE, Centro de Tecnologia e Geociências , Programa de Pós-graduação em Engenharia Elétrica, 2013..
Autor
ALVES, Neide Ferreira
Institución
Resumen
A presente tese descreve as especificações e requisitos para o desenvolvimento de
Bibliotecas Digitais de documentos textuais, considerando a possibilidade de reuso e a
extração de dados. Considerando o imenso volume de informação disponível nesses
repositórios, é de grande interesse a construção de sistemas capazes de selecionar
automaticamente apenas os dados de interesse do usuário, facilitando assim o acesso, a
manipulação e a divulgação dessas informações. O Modelo de Referências de Biblioteca
Digital da DELOS foi utilizado para guiar a construção do ambiente, como consequência
foi desenvolvida a plataforma pLiveMemory com módulos implementados para desktop e
web, neste último, a infraestrutura da nuvem do Google é utilizada. Entre os módulos
desenvolvidos há um específico para identificação e extração de referências bibliográficas,
o qual usa, entre outros, o algoritmo de Naïve Bayes juntamente com as técnicas de
expressões regulares. Também há um módulo para identificação de palavras-chave em
arquivos de formato PDF editável. Os resultados obtidos mostraram os ganhos com a
utilização das estratégias adotadas nas diversas fases do projeto, como na classificação
automática de informação dos textos de artigos científicos.