info:eu-repo/semantics/doctoralThesis
Estructura residual en la región intrínsecamente desordenada de escargot
Autor
TERESA HERNANDEZ SEGURA
Resumen
Resumen
Las proteínas y regiones intrínsecamente desordenadas (IDPs e IDRs por sus siglas en
inglés, respectivamente) no adoptan una estructura tridimensional bien definida en
condiciones fisiológicas. Estas proteínas participan en muchas funciones biológicas y
algunas de ellas están asociadas a diferentes enfermedades. Pequeñas regiones
conocidas como MoRFs (Molecular Recognition Features, en inglés) pueden ser
encontradas en IDPs o IDRs. Los MoRFs son regiones desordenadas que se encuentran
en una constante transición estructural de orden y desorden, lo cual hace difícil su estudio
con herramientas experimentales, ya que la mayoría de estas proporcionan información
promedio del ensamble de diferentes conformaciones. Sin embargo, herramientas
computacionales como las simulaciones de dinámica molecular (MD) permiten estudiarlas
y caracterizar su ensamble conformacional a nivel atómico. En este proyecto estudiamos
la proteína Escargot (Esg) de Drosophila melanogaster, la cual es un factor de
transcripción de la familia Snail, y regula múltiples funciones, entre ellas el desarrollo del
sistema nervioso. Estructuralmente, el dominio C-terminal de Esg es una región
conservada que presenta dedos de Zn2+ e interactúa con ácidos nucleicos, mientras que
el dominio N-terminal es una IDR. Actualmente, hay poca información estructural del Nterminal de Esg; la única anotación funcional en esta región consiste en dos motivos (PDLS-K) que interactúan con la proteína de unión a C-terminal (CtBP). Sin embargo, el Nterminal de Esg ha sido asociado a funciones como degradación de proteínas, donde los
dedos de Zn2+ no son necesarios. En este trabajo, presentamos el primer estudio
bioinformático estructural del N-terminal de Esg de Drosophila melanogaster y diferentes
ortólogos. Los resultados muestran que comparten un extremo N-terminal divergente a
nivel de secuencia, pero probablemente conservado a nivel de desorden y estructura. Las
regiones predichas como ordenadas presentan características de probables MoRFs, los
cuales pudieran ser importantes para ejercer sus funciones como factores de
transcripción. Por otra parte, presentamos el primer estudio estructural computacional del
N-terminal de Esg de Drosophila melanogaster, en el cual investigamos la presencia de
MoRFs. Analizamos una región de ~45 aminoácidos con probabilidad a formar estructuras
ordenadas. A través de 54 μs de simulaciones de dinámica molecular (MD) usando
CHARMM36 y el modelo de solvente implícito Generalizado de Born (GBSA),
caracterizamos el espacio conformacional de esta región y encontramos un MoRF de ~16
aminoácidos. El MoRF adopta estructura de a-hélice y presenta pocos contactos de largo
alcance. También evaluamos y simulamos algunas mutaciones puntuales durante 24 μs
de MD para probar la estabilidad del a-MoRF. Nuestros resultados mostraron que las
mutaciones no desestabilizan el MoRF y llevan a una ganancia modesta de estructura
residual, la cual puede ser efecto del campo de fuerza y modelo de solvente usado, y/o de
contactos de largo alcance. Considerando lo anterior, se realizaron simulaciones de MD
en solvente explícito simulando únicamente la región del a-MoRF. Los resultados
muestran una labilidad distinta para la hélice silvestre y dos mutantes desestabilizantes,
los cuales correlacionan con datos experimentales obtenidos por dicroísmo circular (CD). Abstract
Intrinsically disordered proteins (IDPs) and regions (IDRs) lack a stable, well-defined
structure in physiological conditions. These proteins are involved in multiple biological
functions and some of them are associated to different diseases. Short regions known as
MoRFs (Molecular Recognition Features) can be found in IDPs or IDRs. MoRFs are
disordered regions that are in a constant structural transition of order and disorder, which
is difficult the study with experimental methods, because the results are usually ensembleaveraged over the interconverting conformations. However, computational approaches like
molecular dynamics simulations (MD) allow the study and characterization of
conformational ensembles of IDPs with atomic detailed information. In this project we
studied the Escargot protein (Esg) of Drosophila melanogaster, which is a transcription
factor of the Snail family that regulates multiple cellular functions, including the
development of the nervous system. Structurally, the C-terminal domain of Esg is a
conserved and ordered region that has zinc fingers and interacts with nucleic acids, while
the N-terminal domain of Esg is an IDR. Actually, there is not much structural information
of the N-terminal domain of Esg; the only functional annotation in this region consists of
two (P-DLS-K) motifs that interact with the C-terminal binding protein (CtBP). However, the
N-terminal domain of Esg has been associated to functions like protein degradation, where
zinc fingers are not necessary. In this work, we present the first bioinformatics structural
study of the N-terminal domain of Esg of Drosophila melanogaster and diferent orthologs.
The results show that they share a divergent N-terminal domain at the sequence level, but
are probably conserved at the disorder and structure level. The predicted regions as
ordered present features of probable MoRFs, which could be important in the role as
transcription factors. In addition, we show the first structural computational study of the Nterminal domain of Esg of Drosophila melanogaster, where we researched the presence of
MoRFs. We analized a region of ~45 amino acids with probability to form ordered
structures. Through of 54 μs of molecular dynamics (MD) simulations using CHARMM36
and Generalized Born Implicit Solvent (GBSA), we characterized the conformational
landscape of this region and we found a MoRF of ~16 amino acids. The MoRF adopts the
structure of an α-helix and has few long-range contacts. We also evaluate and simulate
some point mutations during 24 μs of MD to probe the stability of the α-MoRF. Our results
show that the mutations do not destabilize the MoRF and lead to modest gains of residual
structure, which could result from the force field and solvent model used, and/or long-
range contacts. Considering this, simulations of MD were carried out with explicit solvent
only of the α-MoRF region. The results show a different lability of the wild-type helix and
two destabilizing mutants, which correlates with experimental data obtained by circular
dicroism (CD).