Effect of sequence filtering on the assembly of the bacillus altitudinis genome isolated from Ilex paraguariensis

dc.creatorCortese, Iliana Julieta
dc.creatorCastrillo, María Lorena
dc.creatorZapata, Pedro Dario
dc.creatorLaczeski, Margarita Ester
dc.date.accessioned2021-10-22T15:59:51Z
dc.date.accessioned2022-10-15T09:47:26Z
dc.date.available2021-10-22T15:59:51Z
dc.date.available2022-10-15T09:47:26Z
dc.date.created2021-10-22T15:59:51Z
dc.date.issued2021-05
dc.identifierCortese, Iliana Julieta; Castrillo, María Lorena; Zapata, Pedro Dario; Laczeski, Margarita Ester; Efecto del filtrado de secuencias en el ensamblado del genoma de bacillus altitudinis aislado de Ilex paraguariensis; Universidad Nacional de Colombia; Acta Biológica Colombiana; 26; 2; 5-2021; 170-177
dc.identifier1900-1649
dc.identifierhttp://hdl.handle.net/11336/144783
dc.identifierCONICET Digital
dc.identifierCONICET
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/4372187
dc.description.abstractSin importar el tipo de tecnología aplicada para la secuenciación de un genoma, el filtrado de secuencias es un paso esencial, en el cual aquellas lecturas de baja calidad o parte de estas son eliminadas. En un ensamblado la construcción de un genoma se realiza a partir de la unión de lecturas cortas en cóntigos. Algunos ensambladores miden la relación que existe entre secuencias de una longitud fija (k-mer) que puede verse afectada por la presencia de secuencias de baja calidad. Un enfoque común para evaluar los ensamblados se basa en el análisis del número de cóntigos, la longitud del cóntigo más largo y el valor de N50,definido como la longitud del cóntigo que representa el 50% de la longitud del conjunto. En este contexto, el presente estudio tuvo como objetivo evaluar el efecto del uso de lecturas crudas y filtradas en los valores de los parámetros de calidad obtenidos en el ensamblado del genoma de la cepa de Bacillus altitudinis19RS3 aislada de Ilex paraguariensis. Se realizó el análisis de calidad de ambos archivos de partida con el software FastqC y se filtraron las lecturas con el software Trimmomatic. Para el ensamblado se utilizó el softwareSPAdes y para su evaluación la herramienta QUAST. El mejor ensamblado para B. altitudinis19RS3 se obtuvo a partir de las lecturas filtradas con el valor dek-mer79, que generó 16cóntigosmayores a 500 pb con un N50 de 931914 pb y el cóntigo más largo de 966271 pb.
dc.description.abstractSequence filtering is an essential step regardless of the type of technology applied for sequencing a genome, in which low-quality readings or a portion are eliminated. In an assembly, the construction of a genome is carried out from the union of short reads in contigs. Some assemblers measure the relationship between sequences of a fixed length (k-mer) that can be affected by the presence of low-quality sequences. A common approach to evaluating assemblies is based on the analysis of the number of contigs, the length of the longest contig, and the value of N50 defined as the length of the contig representing 50 % of the length of the assembly. In this context, the objective of this study was to evaluate the effect of the use of crude and filtered reads on the values of the quality parameters obtained from the genome assembly of Bacillus altituidinis 19RS3 isolated from Ilex paraguariensis. The quality analysis of both starting files was performed with the FastqC software and the readings were filtered with the Trimmomatic software. The SPAdes software was used for the assembly and the QUAST tool for its evaluation. The best assembly for B. altitudinis 19RS3 was obtained from the filtered readings with the value of k-mer 79, which generated 16 contigs greater than 500 bp with a N50 of 931 914 bp and the longest contig of 966 271 bp.
dc.languagespa
dc.publisherUniversidad Nacional de Colombia
dc.relationinfo:eu-repo/semantics/altIdentifier/doi/http://dx.doi.org/10.15446/abc.v26n2.86406
dc.relationinfo:eu-repo/semantics/altIdentifier/url/https://revistas.unal.edu.co/index.php/actabiol/article/view/86406/77680
dc.rightshttps://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectANALISIS DE SECUENCIAS
dc.subjectBIOLOGIA COMPUTACIONAL
dc.subjectCONTROL DE CALIDAD
dc.subjectGENOMAS BACTERIANOS
dc.titleEfecto del filtrado de secuencias en el ensamblado del genoma de bacillus altitudinis aislado de Ilex paraguariensis
dc.titleEffect of sequence filtering on the assembly of the bacillus altitudinis genome isolated from Ilex paraguariensis
dc.typeinfo:eu-repo/semantics/article
dc.typeinfo:ar-repo/semantics/artículo
dc.typeinfo:eu-repo/semantics/publishedVersion


Este ítem pertenece a la siguiente institución