Tesis
Estudio de características energéticas en zonas de interacción proteína-proteína, para identificación de interacciones transitorias y permanentes
Autor
Gutiérrez Bunster, Tatiana
Institución
Resumen
La mayoría de los procesos celulares que sostienen la vida involucran interacciones entre moléculas,
tales como interacciones ADN-proteína, interacciones entre proteínas, o entre proteínas
y moléculas pequeñas. Por esta razón han sido extensamente estudiadas para intentar
descubrir, como se producen estas interacciones, además se han propuesto métodos para lograr
predecirlas. Esto se traduce en que la biología molecular ha producido gran cantidad de
información funcional y estructural sobre estos complejos. Numerosas estructuras de complejos
proteicos se encuentran disponibles en bancos de datos, sin embargo aún no es posible
predecir exitosamente con un método establecido, las posibles zonas de interacción de una
proteína con otra, así mismo no es posible predecir la estabilidad de la interacción.
La Informática constituye una herramienta poderosa para el estudio de la información funcional
y estructural, además de las características que surgen del análisis de complejos de
interacción Proteína-Proteína. Uno de los problemas cruciales para entender y clasificar interacciones
de proteínas es caracterizar y discriminar la superficie de la interacción. Por esto
se propone que existen algunas características de las superficies de interacción que permiten
discriminar entre complejos proteína-proteína permanentes y complejos proteína-proteína
transitorios.
Para esto, en el presente proyecto se estudian las características energéticas de interfaces de
interacción proteína proteína - área de interacción - de estructura tridimensional conocida,
clasificadas como interacciones transitorias y permanentes, que caracterizan el comportamiento
de un complejo de proteína y sus interacciones.
Para complementar estudios anteriores, es utilizado un algoritmo de selección de características
-forward search- en conjunto con la distancia de Chernoff en una base de datos de
296 complejos permanentes y transitorios. Se utilizó el programa FastContact para obtener la
contribución energética de cada complejo en su área de interacción, obteniéndose 642 características
por complejo.
Para estudiar la precisión en la clasificación, se utilizaron métodos de reducción lineal de dimensiones
-Heteroscedástico HDA, Homoscedástico FDA, Chernoff CDA- combinados con
un clasificador cuadrático y lineal, además de utilizar máquina de soporte de vectores.Lo que
permitió generar un ranking de las características más influyentes para encontrar un factor.
discriminante que distinga la potencialidad de la superficie de interacción de pertenecer a
una interface de interacción -mayor separabilidad entre las clases- o tipos de interacción. Los
mejores resultados estuvieron cercanos al 81% de precisión. Los resultados obtenidos con el
clasificador más preciso se pueden aplicar en el futuro a otros complejos no-clasificados como
herramienta predictiva. La selección realizada utilizando en conjunto el algoritmo foward
search y la distancia de Chernoff alcanzó una alta precisión. El análisis de las mejores características
discriminantes muestra que las energías de desolvatación contribuyen por sobre la energía electrostática a la separación de clases.