Tesis
Modelagem da síntese de proteínas e sua estrutura organizacional através de códigos corretores de erros
Modeling of protein synthesis and its organizational structure by the use of error correcting codes
Registro en:
DUARTE GONZALEZ, Mario Enrique. Modelagem da síntese de proteínas e sua estrutura organizacional através de códigos corretores de erros. 2017. 1 recurso online (174 p.). Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação, Campinas, SP.
Autor
Duarte Gonzalez, Mario Enrique, 1986-
Institución
Resumen
Orientador: Reginaldo Palazzo Junior Tese (doutorado) - Universidade Estadual de Campinas, Faculdade de Engenharia Elétrica e de Computação Resumo: O uso da teoria da informação e codificação nos sistemas biológicos emergiu como uma alternativa para a explicação de como o sistema biológico é capaz de manipular a informação genética nos processos de replicação de DNA e síntese de proteínas. Alguns modelos para o sistema biológico, decorrentes dessas pesquisas, têm sido estabelecidos no contexto da teoria da informação. Nos últimos trabalhos deste grupo de pesquisa, introduziu-se um modelo inovador para a importação de proteínas organelares, com o qual, foi possível mostrar que algumas sequências moleculares (DNA, RNA e mRNA) têm uma estrutura matemática no contexto da teoria de codificação. Utilizando o recente modelo, a proposta deste trabalho consiste, primeiro, em demonstrar alguns fatos matemáticos que ficaram em aberto em trabalhos recentes e, segundo, em validar as hipóteses que o Ribossomo age como o modulador do sistema biológico e que as proteínas possuem uma estrutura organizacional similar à estrutura de um código corretor de erros. Para realizar a validação das hipóteses, definiram-se duas possíveis abordagens. A primeira consistiu em mostrar que as sequências mRNA podem ser codificadas por um código BCH sobre Z_4 ou F_4 e que o ribossomo age simplesmente como o mapa sobrejetor de códons para aminoácidos de acordo com o ''Código Genético''. Assim a estrutura organizacional das proteínas é herdada deste código corretor de erros presente nas sequências mRNA. A segunda abordagem, inspirou-se no trabalho de Zyablov, que introduz o conceito de Codificador Genético Concatenado, o qual unifica o codificador com o modulador, e verifica que as proteínas podem ser codificadas por um código cíclico sobre Z_20 ou F_4xZ_5, construído através de códigos BCH. Os resultados obtidos mostraram a existência de uma estrutura matemática nas proteínas, no contexto de teoria de comunicação, a qual, permitiu agrupar algumas proteínas Cythocrome b6-f complex subunit 6-OS de diferentes organismos em um único grupo monofilético com um controle de replicação de 99%, o qual não é usual inclusive para proteínas altamente conservadas evolutivamente. Finalmente, este trabalho contribui no desenvolvimento de uma metodologia que poderá ser aplicada em produção de novos fármacos, melhoramento genético, entre outros Abstract: The use of information and coding theory in biological systems emerged as an alternative to explain how the biological system is able to manipulate genetic information in the DNA replication and protein synthesis processes. Some models for the biological system, derived from those researches, have been established on the information theory framework. In recent works from this research group, a novel model for the import of organelles protein has been introduced; this model allowed to show that some molecular sequences (DNA, RNA and mRNA) have a mathematical structure in the coding theory framework. Using the recent model, this work proposal was, first, to demonstrate some mathematical facts that remain open from recent studies and, second, to validate the hypotheses that the Ribosome acts as the modulator of the biological system and that the proteins have an structural organization similar to the structure of error-correcting codes. In order to validate these hypothesis, two possible approaches were proposed. The first one consists in showing that mRNA sequences can be encoded by a BCH code over Z_4 or F_4 and that the ribosome acts simply as a surjective map from codons to amino acids according to the ''Genetic Code'', thus, the structural organization of proteins is inherited from the error-correcting code present in the mRNA sequences. The second approach was inspired by Zyablov's work, and it introduces the concept of the Concatenated Genetic Encoder, which unifies the encoder and the modulator, and verifies that the proteins can be encoded by a cyclic code over Z_20 or F_4xZ_5, constructed by BCH codes. The obtained results demonstrate the existence of a mathematical structure within proteins in the communication theory framework, which allowed to group some Cythocrome b6-f complex subunit 6-OS proteins of different organisms in a single monophyletic group with a replication control of 99%, not usual even for highly evolutionarily conserved proteins. Finally, this work contributes to the development of a methodology that can be applied in the production of new drugs, genetic improvement, among others Doutorado Telecomunicações e Telemática Doutor em Engenharia Elétrica CAPES