Papers presented at events
A integração do Arca - Repositório Institucional da Fiocruz com a Plataforma de Ciência de Dados aplicada à Saúde
Registro en:
QUEIROZ, Claudete Fernandes de et al. A integração do Arca - Repositório Institucional da Fiocruz com a Plataforma de Ciência de Dados aplicada à Saúde. In: CONFERÊNCIA INTERNACIONAL SOBRE BIBLIOTECAS E REPOSITÓRIOS DIGITAIS DA AMÉRICA LATINA, 9., 2019, São Paulo. Anais... São Paulo: BIREDIAL-ISTEC, 2019. 13 p.
Autor
Queiroz, Claudete Fernandes de
Maranhão, Ana Maria Neves
Araujo, Luciana Danielli de
Nascimento, Andréa Gonçalves do
Rodrigues, Raphael Belchior
Lima, Jefferson da Costa
Pedroso, Marcel de Moraes
Freyre, Éder de Almeida
Resumen
Apresenta o projeto desenvolvido entre o Laboratório de Ciência de Dados aplicada à Saúde, do Instituto de Informação Científica e Tecnológica em Saúde (ICICT) e o Arca – Repositório Institucional da Fiocruz. O projeto teve como objetivo melhorar a curadoria de dados, através da identificação de inconsistências no preenchimento dos metadados, utilizando classificação automática e machine learning, e consequente correção, visando assim, garantir a qualidade das informações e dos dados extraídos. Outro fator importante para a realização do projeto foi a utilização do software Kibana e do Elastsearch para a visualização de dados de forma dinâmica, oferecendo uma plataforma de exploração interativa para extração e mineração de dados. O software permitiu a utilização de filtros e combinações de dados contidos no Arca, como produção por tipo de material, Unidades da Fiocruz, assunto, autor, ano e direito autoral de forma que possam ser manipulados pelas diferentes unidades/comunidades representadas no Repositório Institucional.