Tesis
Análise informacional dos enterramentos atômicos em proteínas globulares
Registro en:
ROCHA, Juliana Ribeiro. Análise informacional dos enterramentos atômicos em proteínas globulares. 2012. 91 f. Dissertação (Mestrado em Biologia Molecular)-Universidade Brasília, Brasília, 2012.
Autor
Rocha, Juliana Ribeiro
Institución
Resumen
Dissertação (mestrado)-Universidade Brasília, Instituto de Ciências Biológicas, Departamento de Biologia Molecular, 2012. O estudo do enovelamento de proteínas e a predição de suas estruturas nativas são de grande importância para a ciência. Uma das abordagens possíveis para tal predição tem base nos enterramentos atômicos, entendidos como a distância do átomo até o centro geométrico da proteína normalizada pelo raio de giro da proteína. Esses enterramentos podem ser discretizados em camadas concêntricas e equiprováveis e já foi mostrado que a informação sobre estas camadas é su_ciente para levar a proteína ao seu estado nativo (Pereira de Araújo et al., Proteins 70:971-983, 2008; Pereira de Araújo e Onuchic, PNAS 106:19001-19004, 2009), mas não se sabe como esta informação está codi_cada na sequência. O objetivo do presente trabalho é medir a transinformação, quantidade de informação compartilhada por duas ou mais variáveis aleatórias discretas, entre sequência e enterramentos atômicos a partir de quatro diferentes alfabetos de sequência e de diversos números de níveis de enterramento atômico visando entender as relações entre essas variáveis e, assim, fornecer um máximo teórico para a e_ciência dos algoritmos de predi- ção de enterramentos atômicos. Os resultados deste trabalho mostram que a sequência de aminoácidos possui densidade de entropia entre 0; 9969 _ 0; 0002 bit e 4; 176 _ 0; 004 bit, dependendo do número de símbolos do alfabeto considerado (dois, três, cinco ou vinte símbolos), e excesso de entropia sempre próximo a zero. Portanto, infere-se que não existe correlação local entre os elementos da sequência. Por outro lado, os enterramentos atômicos apresentam densidade de entropia variando de 0; 617_0; 002 bit a 2; 16_0; 04 bit para C_ e de 0; 735_0; 002 bit a 2; 54_0; 01 bit para C_, de acordo com a quantidade de níveis de enterramento considerados (de dois a dez níveis), e excesso de entropia compreendido entre 0; 53 _ 0; 01 bit e 1; 4 _ 0; 1 bit para C_ e entre 0; 48 _ 0; 02 bit e 0; 93 _ 0; 04 bit para C_. Estes resultados evidenciam que os enterramentos atômicos são correlacionados localmente entre si. Foi encontrada uma relação entre enterramento atômico e estrutura secundária, na qual as _-hélices são distribuídas por todo o espaço ocupado pela proteína, as folhas-_ tendem aos níveis mais internos e segmentos sem estrutura secundária regular tendem a ocupar os níveis mais externos. A densidade de entropia da sequência é maior que a dos enterramentos atômicos se considerados alfabetos de mesmo tamanho, ou seja, aquela é potencialmente capaz de armazenar a informação necessária para a determinação deste. Entretanto, a transinformação entre sequência e enterramento (calculada para C_ e para C_) não é maior que 20% da dúvida do mesmo. Essa porcentagem é aparentemente pequena, mas é possível que mesmo esta quantidade de informação seja su_ciente para a predição dos enterramentos nativos, uma vez que a dúvida em relação ao enterramento de um átomo deve diminuir quando o de seu vizinho é conhecido, o que também foi mostrado neste trabalho. A combinação dos resultados deste provê um máximo teórico para os algoritmos de predição e permite saber se eles estão próximos deste máximo. _________________________________________________________________________ ABSTRACT Protein folding understanding and protein terciary structure prediction are two main areas in science nowadays. One approach to terciary structure prediction has its basis in atomic burials, understood as the distance from a speci_c atom to the molecular geometrical center divided by protein's radius of giration. Atomic burials can be discretized in concentric and equiprobable burial layers, and it has been shown that information about these layers cary an amount of information enough to lead protein to its native structure (Pereira de Araújo et al., Proteins 70:971-983, 2008; Pereira de Araújo and Onuchic, PNAS 106:19001-19004, 2009), althougth it is not elucidated how this information is held to the sequence. The intend of this work is to measure mutual information, de_ned as the amount of information shared between two or more discrete random variables, between sequence and atomic burials considering di_erent combinations of sequence alphabets and number of burial layers, with the aim of understanding the relations between them and, therefore, contribute protein terciary structure prediction algorithms. The obtained results show that aminoacids sequence has entropy density ranging from 0; 9969_0; 0002 bit to 4; 176_0; 004 bit, according to the number of symbols of the considered alphabet (two, three, _ve or twenty symbols), and excess entropy approximately equal to zero. Taken together, these results demonstrate that sequence elements are not locally correlated. On the other hand, C_ and C_ atomic burials have shown entropy density from 0; 617_0; 002 bit up to 2; 16_0; 04 bit, and from 0; 735_0; 002 bit up to 2; 54_0; 01 bit, respectively, according to the number of burial levels considered (from two to ten levels). Its excess entropy vary from 0; 53_0; 01 bit to 1; 4_0; 1 bit and from 0; 48_0; 02 bit to 0; 93_0; 04 bit, taking C_ and C_ respectively. These results point that atomic burials elements have local correlation. In addition, a relation between atomic burials and secondary structure was evidenced, taken that Loops tend to external levels, _-sheets tend to internal levels and _-helices are homogeneously distributed through the protein radius. Sequence entropy density is major than atomic burials entropy density, i.e. sequence is theoretically capable of holding the amount of information necessary to determine atomic burials. However, mutual information between sequence and burials (calculated considering C_ and C_) is not greater than 20% of burial uncertainty. This percentage is apparently small, but is it possible that even this few information is enough to a correct prediction of atomic burials once that the entropy with respect to one atom shall decrease once its neigbour's position is known, which has also been shown here. The results obtained here provide a theoretical maximum that can be achieved by prediction algorithms, and therefore permit measure their e_ciency.