Artículos de revistas
Análise de desempenho de Banco de Dados Relacionais e Não Relacionais em dados genômicos
Registro en:
10.22456/2175-2745.71775
Autor
Barros, Juccelino Rodrigues Alves
Callou, Gustavo Almeida
Gonçalves, Glauco
Wanderley, Victor
Casteletti, Henrique
Resumen
O armazenamento de dados genômicos é um grande desafio hoje, poiscom o avanço da tecnologia molecular a quantidade de dados genômicos geradosestá aumentando, de forma que o sequenciamento de um único organismo podegerar arquivos com gigabytes de informações. De forma geral, os processos demanipulação de dados genômicos fazem uso de simples arquivos como o principalmeio para armazenamento de tais dados. Contudo, os bancos de dados modernosse apresentam como alternativa para a gerência desses dados por oferecer melhororganização, tolerância a falhas, melhor uso do espaço disponível para armaze-namento e desempenho. Além disso, os bancos de dados permitem agregar aosdados brutos do sequenciamento meta-informações acerca das sequências de DNAarmazenadas. Diante deste cenário, este trabalho apresenta e avalia o desempenho dediferentes estratégias de armazenamento em três bancos de dados pertencentes a doisparadigmas diferentes, o MySQL (representante dos bancos de dados Relacionais), oCassandra e o MongoDB (representantes dos bancos de dados Não Relacionais). Osresultados demonstraram que os bancos de dados relacionais apresentam limitaçõesquando estão inseridos em um ambiente com grandes massas de dados.