Uso de técnicas de cómputo paralelo para la detección de los principales aminoácidos de interfaz en los complejos proteicos implicados en procesos óseos
Fecha
2020-01-09Registro en:
Chaparro Amaro, Oscar Roberto. (2019). Uso de técnicas de cómputo paralelo para la detección de los principales aminoácidos de interfaz en los complejos proteicos implicados en procesos óseos (Maestría en Ciencias de la Computación). Instituto Politécnico Nacional, Centro de Investigación en Computación, México.
Autor
Chaparro Amaro, Oscar Roberto
Institución
Resumen
RESUMEN:
La dirección de este trabajo es mejorar las metodologías que abordan el análisis de biomoléculas como las técnicas computacionales, las cuales han podido sustituir pruebas y ensayos experimentales mediante la simulación. Muchos de estos métodos tiene limitantes tanto como espaciales y temporales y en muchos casos, falta de datos suficientes para validación.
Los aminoácidos que se buscan en este trabajo corresponden a los HotSpot y HotRegions definidos en idioma inglés, los cuales median las interacciones químicas entre las proteínas. Entonces, esta proposición alternativa consiste en recolectar de la base de datos Protein Data Bank, información respecto a su conformación espacial para obtener algunos parámetros específicos que son esenciales para identificarlos. Igualmente, el desempeño de los algoritmos usados para calcular algunos de estos parámetros se mejoran en tiempo de ejecución mediante técnicas de cómputo paralelo como SIMD y SIMT. Así mismo, se aplican y evalúan técnicas de reconocimiento de patrones con enfoque supervisado para poder diferenciar a los HotSpots y HotRegions.
Finalmente, se presentan los resultados del desempeño ganado cuando se aplican las estrategias de cómputo paralelo a los algoritmos de cálculo de la energía de estado base y el área de acceso al solvente. Con base en los parámetros seleccionados y los datos disponibles, la metodología propuesta seleccionó un clasificador para predecir HotSpot y HotRegions con buena sensibilidad y precisión.
ABSTRACT:
The direction of this work is to improve the methodologies that deal with biomolecules analysis as computational techniques, which has been able to substitute clinical test by simulation. Many of these methods have limitations as spatial, temporal and in many cases, lack of data for validation.
The amino acids that are the aim of this work are the HotSpot and HotRegions, which mediate the chemical interactions between proteins. Thus, this proposed alternative methodology consists of recovering, from the Protein Data Bank , information regarding to their spatial conformation in order to obtain some specific parameters that are essential for identifying them. Likewise, performance of algorithms used to calculate some of these parameters are improved in execution time through computing parallel techniques as SIMD and SIMT. Moreover, pattern recognition techniques with supervised focus are applied and evaluated for distinguishing HotSpot and HotRegions.
Finally, gain performance results are presented when computing parallel strategies are applied to ground state energy calculation and to access solvent area algorithms. Based on selected parameters and available data, the proposed methodology selected a classifier for predicting HotSpot and HotRegions with good recall and precision.