Thesis
Eficiencia en el ensamblado De Novo de secuencias de RNA-Seq. Estudio de la performance de algoritmos
Fecha
2020Autor
Reinaudi, Claudia P.
Institución
Resumen
En los últimos años, impulsado principalmente por la implementacion y finalizacion exi-
tosa del Proyecto Genoma Humano (HGP - Human Genome Project), se ha producido
un importante auge en materia de desarrollo tecnologico relacionado con la secuenciacion
de acidos nucleicos (Deoxyrribonucleic Acid - DNA y Ribonucleic Acid - RNA) de los
seres vivos, dando lugar a una significativa reduccion del costo econ ́omico del uso de la
tecnologıa, facilitando su utilizacion en proyectos de diferente escala.
Se denomina genoma al conjunto completo de material genetico en forma de DNA que
contiene un organismo [3]. La mol ́ecula de DNA est ́a compuesta por una larga cadena de
nucle ́otidos, cuya secuencia almacena toda la informaci ́on necesaria para la vida de un or-
ganismo, y se transmite entre las generaciones. Consiste en dos cadenas que se mantienen
unidas y se enrollan entre ellas para formar una estructura de doble h ́elice. Cada cadena
tiene una parte central formada por az ́ucares (desoxirribosa) y grupos fosfato, formando
una unidad, en la que se une una de las siguientes cuatro bases nitrogenadas: adenina
(A), citosina (C), guanina (G), y timina (T), terminando de conformar el nucleotido (
Figura N
o
1). Las dos cadenas se mantienen unidas por enlaces quımicos entre las bases,
de manera complementaria: la adenina se enlaza con la timina (A - T), y la citosina con la
guanina (C - G). La secuencia de estas bases a lo largo de la cadena de DNA es el codigo
para formar moleculas de RNA que luego se traduciran en proteınas, dogma central de
la biologıa molecular
que describe el flujo de la informacion genetica, que se almacena
en el DNA en forma de genes, se transcribe en moleculas de RNA que luego se traducen
en proteınas [4], procesos que ocurren simultaneamente en cada celula de un organismo
vivo, en los que el RNA cumple un rol de codificador de la informacion entre el DNA y
las prote ́ınas. El conjunto de mol ́eculas de RNA sintetizadas en un momento y/o condi-
ci ́on particular de la vida del organismo se denomina transcriptoma, y son esenciales para
interpretar los elementos funcionales contenidos en el DNA.