Trabalho de conclusão de graduação
Avaliação de consultas executadas sobre bases de dados de proveniência distribuídas
Autor
Santos, Edimar Babilon dos
Assis, Vanessa Marques de
Institución
Resumen
Devido à cooperação entre centros de pesquisas e à necessidade de alto
desempenho computacional, a execução de workflows científicos vem sendo cada vez
mais realizada em ambientes distribuídos. Sendo assim, uma grande quantidade de
dados de proveniência da execução dos workflows é gerada de maneira, também, cada
vez mais distribuída. Para conseguirmos manter características fundamentais dos
experimentos científicos, tais como sua reprodutibilidade, a informação de proveniência
deve ser capturada mesmo tendo o experimento sido executado em ambientes
distribuídos. Os dados de proveniência gerados sob a execução de um experimento
serão úteis para a sua gerência e também poderão ser usados em futuras execuções, para
análises de desempenho ou de confiança dessas novas execuções, onde, por meio de
análises de informação histórica, somos capazes de inferir uma série de conclusões.
Sendo assim, é importante avaliar como tais dados deverão estar organizados, de
maneira a otimizar os tempos das consultas frequentemente realizadas pelos cientistas.
Para isso, este projeto propõe uma fragmentação dos dados de proveniência de
workflows e realiza uma análise de desempenho a fim de avaliar se a fragmentação
proposta traz ou não benefícios.