info:eu-repo/semantics/masterThesis
Predicción de regiones de cromatina abierta a partir del perfil de activación de la histona H3K27ac
Prediction of open chromatin regions from H3K27ac ChIP-Seq profiles
Autor
CESAR MIGUEL VALDEZ CORDOVA
Institución
Resumen
En el contexto de la epigenética, la determinación de la estructura de la cromatina asociada a las modificaciones histonales y sus dinámicas asociadas es crucial para perfilar con precisión los fenómenos relacionados con procesos biológicos complejos, tales como, la diferenciación celular, el proceso de desarrollo celular y la aparicióny progresión de diversas enfermedades. La predicción de la estructura de la cromatina, y en particular, la identificación de los sitios accesibles de cromatina son problemas biológicos fundamentales que están siendo activamente investigados. En esta tesis, presentamos un clasificador binario, basado en una máquina de soporte vectorial (SVM), entrenado con datos disponibles de ChIP-sec y ATAC-sec derivados de experimentos relacionados con la modificación histonal H3K27ac. Nuestro modelo utiliza características construidas a partir de señales que se extraen directamente de los datos genómicos de acuerdo con una abstracción computacional basada en un fenomeno biológico, con el objetivo de determinar si es posible predecir sitios de ATAC-seq a partir de datos de ChIP-seq. Nuestro modelo con mejor desempeño puede identificar exitosamente el 82,84 % de los intervalos de ATAC-seq que coinciden con intervalos de ChIP-seq. Para la realización de las pruebas se desarrolló histoneSig, un paquete de R que está disponible en github para uso público. Si bien los resultados iniciales son prometedores, nuestro modelo aún necesita ser capaz de cuantificar y discernir el número de regiones asociadas y sus diferentes grados de accesibilidad. Idealmente, esto ayudará en el desarrollo de abstracciones biológicas cada vez más robustas, lo cual resultará en características más informativas y altamente generalizables. In the context of epigenetics, determining chromatin structure associated to histonal modifications and its associated dynamics is crucial for accurately profiling phenomena related to complex biological processes, such as cellular differentiation, development and disease onset and progression. Prediction of chromatin structure, and in particular, the identification of accessible chromatin sites are fundamental, actively researched biological problems. In this thesis, we present a binary Support Vector Machine (SVM) classifier trained on openly available ChIP-seq and ATAC-seq data derived from experiments related to the H3K27ac histonal modification. Our model utilizes features constructed from signals that are extracted directly from genomics data in accordance with a computational abstraction that is based on a biological phenomenon, with the goal of determining if it is possible to predict ATAC-seq sites from ChIP-seq data. Our top performing model can successfully identify 82.84 %. of the ATAC-seq intervals that overlap with ChIP-seq intervals. To perform the various tests contained in this thesis, an R package, histoneSig, was developed. It is available on github for public use. While initial results are promising, our model still needs to be able to discern the number of associated regions and different degrees of accessibility. This will ideally aid in the development of increasingly robust biological abstractions, which will result in more informative, highly generalizable features.
Materias
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Compendio de innovaciones socioambientales en la frontera sur de México
Adriana Quiroga -
Caminar el cafetal: perspectivas socioambientales del café y su gente
Eduardo Bello Baltazar; Lorena Soto_Pinto; Graciela Huerta_Palacios; Jaime Gomez -
Cambio social y agrícola en territorios campesinos. Respuestas locales al régimen neoliberal en la frontera sur de México
Luis Enrique García Barrios; Eduardo Bello Baltazar; Manuel Roberto Parra Vázquez