tesis de maestría
Algoritmos de aprendizaje automático en la identificación de miARNS potencialmente asociados a discapacidades intelectuales no sindrómicas
Fecha
2022-05-20Autor
González Betancur, Julián
Institución
Resumen
Las Discapacidades intelectuales (IDs) son un grupo de trastornos del neuro-desarrollo
con una alta heterogeneidad fenotípica y genotípica. La asociación de elementos
genéticos, como genes, micro-ARNs o ARNs largos no codificantes, con IDs ha sido
abordada de forma empírica. Sin embargo, recientemente, los modelos de aprendizaje
automático (ML) han demostrado ser excelentes herramientas en la elucidación de
estas asociaciones entre las causas genéticas y los fenotipos de ID. Los micro-ARNs
son transcritos cortos no codificantes que participan en la regulación espacio-temporal
de la expresión génica, lo cual los hace relevantes en el entendimiento de la causalidad
genética de las IDs.
En la presente tesis, se utilizó la base de datos del cerebro en desarrollo BrainSpan, la
cual contiene información de patrones de expresión espacio-temporal en el cerebro
humano. Esta base de datos fue utilizada en el desarrollo de una serie de modelos de
ML clasificadores de diferentes tipos: Máquinas de Soporte Vectorial (SVM), Bosques
Aleatorios (RF) y Redes Neuronales Artificiales Pre-Alimentadas (FF-ANN). Estos
modelos fueron entrenados para clasificar perfiles de expresión génica entre aquellos
asociados y no asociados a IDs. El mejor modelo obtenido fue del tipo FF-ANN, con
0.78 de puntaje F1, 0.78 de rellamado y 0.78 de precisión. Este modelo fue utilizado
para clasificar patrones de expresión de micro-ARNs, se filtraron todos aquellos micro ARNs con una alta probabilidad de estar asociados a ID. Se realizó una búsqueda de
literatura que vinculara estos micro-ARNs, o sus genes blanco, con neuro-desarrollo o
con IDs.