Tesis
Comparação algebrica de genomas : o caso da distancia de reversão
Algebraic genome comparison : the case of reversal distance
Registro en:
(Broch.)
Autor
Almeida, André Atanasio Maranhão, 1981-
Institución
Resumen
Orientador: João Meidanis Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Computação Resumo: Nas últimas décadas presenciamos grandes avanços na biologia molecular que levaram ao acúmulo de um grande volume de dados acerca de moléculas, tais como DNAs e proteínas, essenciais para a vida e para seu entendimento.O estágio atual é de busca por ferramentas que permitam extrair informações com relevância biológica destes dados. Neste contexto, a comparação de genomas surge como uma das ferramentas e nesta categoria incluímos rearranjo de genomas. Em rearranjo, o genoma é representado por uma seqüência de blocos conservados e, dados dois genomas e um conjunto de operações, busca-se pela que transformem um genoma no outro. Em 1995, Hannenhallie Pevzner apresentaram o primeiro algoritmo polinomial para o problema da ordenação por reversões orientadas. Tal algoritmo executa em tempo O(n4) e foi o primeiro algoritmo polinomial para um modelo realístico de rearranjo de genomas. Desde então, surgiram algoritmos que apresentam desempenho assintoticamente melhor. O melhor deles, apresentado por Tannier e Sagot em 2004, é capaz de executar em tempo O (n(n log n)1/2). Há um algoritmo linear, desenvolvido por Bader e colegas[2], mas este capaz de determinar a seqüência de reversões, apenas calcula a distância. Motivado pela carência de uma derivação algébrica mais formal da teoria desenvolvida em rearranjo de genomas, desenvolvemos uma solução formal para o problema da distância de reversão com sinal. Utilizamos, em tal solução, um formalismo algébrico para rearranjo de genomas que relaciona a recente teoria de rearranjo de genomas ?basicamente fundamentada no trabalho de Hannenhalli e Pevzner ? e a teoria de grupos de permutação de uma nova forma. Pretendemos criar a base para grandes avanços na área através de um formalismo algébrico forte Abstract: In the last decades we have seen a great progress in molecular biology. That lead to a large volume of data on molecules, DNA and proteins, essential for life.The current stage of research lies in the pursuit of tools to extract information with biological relevance from this data. In this context, comparison of genomes is an important tool and genome rearrangements is a way of doing that comparison. In rearrangement analysis the genome is represented by a sequence of conserved blocks. The aim is to ?nd a minimum sequence of operations that transform a genome into another given as input two genomes and a set of allowed operations. In 1995, Hannenhalli and Pevzner presented the ?rst polinomial algorithm for sorting signed permutations by reversals. This algorithm has complexity O(n4) in time and was the ?rst polinomial algorithm for a realistic model of genome rearrangement. Since then, new algorithms with better asintotic performance had appeared. The fastest algorithm, with complexity O(n?n logn), was developed byTannier and Sagot in 2004. Motivated by a lack of a more formal derivation in the genome rearrangement developed theory, we developed a formal solution for the signed reversal distance problem. We use an algebraic formalism that relates the recent genome rearrangement theory ? basically based on a work of Hannenhalli and Pevzner ? to permutation group theory in a new form. We intend to build a solid theoretical base for further advances in the area through strong algebraic formalism Mestrado Teoria da Computação Mestre em Ciencia da Computação