dc.contributorLópez, Camilo (Thesis advisor)
dc.creatorLeal Ayala, Luis Guillermo
dc.date.accessioned2019-06-25T19:54:38Z
dc.date.available2019-06-25T19:54:38Z
dc.date.created2019-06-25T19:54:38Z
dc.date.issued2013-11
dc.identifierhttps://repositorio.unal.edu.co/handle/unal/21850
dc.identifierhttp://bdigital.unal.edu.co/12850/
dc.description.abstractDiversos métodos estadísticos son aplicados a la investigación de redes complejas, por ejemplo en la construcción y comparación de redes de coexpresi´on génica (RCG). Las RCG muestran de forma gráficas cómo los genes de un ser vivo participan coordinadamente en los procesos celulares. Las RCG esquematizan el funcionamiento global del sistema biológico por medio de nodos (genes) y aristas (relaciones funcionales entre genes), con base en datos experimentales. En este trabajo se identifican varias limitaciones previa- mente reportadas en las metodologías de construcción y comparación de RCG. Se evalúan y seleccionan los métodos más indicados para mejorar desde un enfoque estadístico las estrategias empleadas actualmente. La tesis hace los siguientes aportes: • En la construcción de RCG: – Se emplea una medida de similitud que considera las asociaciones no lineales entre los datos de expresión. – Se adapta un método basado en coeficientes de agrupamiento para establecer las aristas de la red. • En la comparación de RCG: – Se proponen nuevas variables capaces de capturar información topológica y biológica intrínseca en la red. – Se comparan las redes aplicando un análisis en componentes principales seguido de una clasificación no jerárquica. La metodología se evaluó con datos obtenidos en experimentos de inmunidad en las plantas: arroz, soya, tomate, yuca y Arabidopsis. Los resultados demuestran que las RCG construidas con esta metodología contienen aristas valiosas para entender el sistema. Se encontró una forma objetiva y confiable de construir la red, con la cual se reduce el ruido de los datos y se evitan aristas no significativas. Con el objetivo de caracterizar las redes, se demostró que las nuevas variables son independientes del tamaño de la red y aportan información valiosa para comprender los sistemas en estudio. Finalmente, al hacer la clasificación de las redes en el espacio factorial, se encontraron patrones de similitud entre las redes, al igual que asociaciones entre las variables que las describían.
dc.description.abstractAbstract: Statistical methods are used in scientific research to study complex networks such as gene coexpression networks (GCNs). These networks show how genes take part of cellular processes coordinately. GCNs depict the biological systems by means of nodes (genes) and edges (functional relationships between genes), based on experimental data. In this work, some shortcomings of current methodologies for construction and comparison of GCNs are studied. Several methods were evaluated and the most suitable were selec- ted to propose a novel enhanced statistical methodology. This thesis makes the following contributions: • To the construction of GCNs: – A similarity measure that takes into account nonlinear relationships on data is used. – A novel method based on clustering coefficients was adapted with the aim of defining the network’s edges. • To the comparison of GCNs: – New variables that summarize topological and biological information of the GCNs were proposed. – A principal component analysis and the non-hierarchical classification method of K-Means were applied with the aim of studying the GCNs based on multi- variate analyses. This methodology was applied using gene expression data that were obtained from immunity experiments of the plants: rice, soybean, tomato, cassava and Arabidopsis. The results show that many important edges were included in GCNs, but also the noise of data was reduced to avoid non-significant edges. The variables used to characterize GCNs are nondependent on networks’ size and revealed new information to understand the biological system. Finally, the GCNs classification on the principal component’s space, allowed the finding of similar networks and of dependences among variables.
dc.languagespa
dc.relationUniversidad Nacional de Colombia Sede Bogotá Facultad de Ciencias Departamento de Estadística
dc.relationDepartamento de Estadística
dc.relationLeal Ayala, Luis Guillermo (2013) Desarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica. Maestría thesis, Universidad Nacional de Colombia.
dc.rightsAtribución-NoComercial 4.0 Internacional
dc.rightshttp://creativecommons.org/licenses/by-nc/4.0/
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsDerechos reservados - Universidad Nacional de Colombia
dc.titleDesarrollo de una metodología estadística aplicada a la construcción y comparación de redes de coexpresión génica
dc.typeTrabajo de grado - Maestría


Este ítem pertenece a la siguiente institución