Trabajo de grado - Maestría
Métodos para identificar asociaciones entre genotipos y múltiples fenotipos
Fecha
2023Registro en:
Universidad Nacional de Colombia
Repositorio Institucional Universidad Nacional de Colombia
Autor
Acero Baena, Juan Pablo
Institución
Resumen
La secuenciación de genomas ha permitido aumentar el conocimiento en varios aspectos de la biología
de los organismos. Una de las principales ramas que ha surgido es el estudio de asociación del genoma completo
(Genome Wide Association Studies, GWAS), el cual ha permitido por medio de la asociación entre
genotipos y fenotipos, identificar aspectos genotípicos relacionados con enfermedades complejas tales como
el Alzheimer , la diabetes, el cáncer, entre otras.
Originalmente, la mayor parte de estos estudios se han realizado para un solo fenotipo, por esta razón, tomando
como base la metodología presentada por Guo y Wu, 2018 se evaluaron las asociaciones entre genotipos y
fenotipos múltiples aplicando los métodos Principal Component Based Association Test, denotado como ET,
Omnibus Test (OT) y Adaptative Test (AT), sobre tres bases de datos reales y un set de datos simulados
binarios correlacionados. Así mismo, se evaluaron los desempeños de las metodologías comparándolas entre
sí, teniendo en cuenta su capacidad para rechazar la mayor cantidad de hipótesis en pruebas múltiples y la
potencia en los datos simulados.
La comparación y caracterización de los métodos permitió establecer un flujo de trabajo óptimo, una
identificación de los puntos positivos y negativos de cada una de las metodologias probadas. Igualmente,
en la aplicación a bases de datos reales y simuladas se identificaron los aspectos a considerar para tener un
m´etodo más sensible y específico. Se evaluó la mejora propuesta que consistió en la inclusión de la frecuencia
y proporción de los alelos raros de cada SNP en el método AT. Estos resultados permitieron observar una
mejora en la potencia del método AT, demostrando que la inclusión de dicha frecuencia es un insumo
importante para detectar una mejor asociación entre un fenotipo y un genotipo. (Texto tomado de la fuente) Genome sequencing has increased knowledge in various aspects of the biology of organisms. One of the
main branches that has emerged is the Genome Wide Association Studies (GWAS), which has allowed,
through the association between genotypes and phenotypes, to identify genotypic aspects related to complex
diseases such as Alzheimer’s, diabetes, cancer, among others, to identify genotypic aspects related to complex diseases such as Alzheimer’s disease, diabetes, cancer, among others.
Originally, most of these studies have been performed for a single phenotype, for this reason, taking as
a basis the methodology presented by Guo y Wu, 2018, the associations between genotypes and multiple
phenotypes were evaluated by applying the methods ¨textitPrincipal Component Based Association Test,
denoted as ET, Omnibus Test (OT) and Adaptative Test (AT), on three real datasets and a correlated binary
simulated dataset. The performance of the methodologies was also evaluated by comparing them with each
other, taking into account their ability to reject the largest number of hypotheses in multiple testing and
the power in the simulated data.
The comparison and characterization of the methods allowed establishing an optimal workflow, an identification of the positive and negative points of each of the tested methodologies. Likewise, in the application
to real and simulated databases, the aspects to be considered in order to have a more sensitive and specific
method were identified. The proposed improvement that consisted in the inclusion of the frequency and
proportion of rare alleles of each SNP in the AT method was evaluated. These results allowed observing
an improvement in the power of the AT method, demonstrating that the inclusion of such frequency is an
important input to detect a better association between a phenotype and a genotype