masterThesis
Classificação de Proteínas usando Máquinas de Aprendizagem e Descoberta de Padrões
Registro en:
do Nascimento Júnior, Francisco; Ing Ren, Tsang. Classificação de Proteínas usando Máquinas de Aprendizagem e Descoberta de Padrões. 2008. Dissertação (Mestrado). Programa de Pós-Graduação em Ciência da Computação, Universidade Federal de Pernambuco, Recife, 2008.
Autor
do Nascimento Júnior, Francisco
Institución
Resumen
Máquinas de aprendizagem têm sido aplicadas em diferentes problemas em Bioinformática.
Similarmente, algoritmos de descoberta de padrões também têm sido usados para descobrir
motifs em seqüências de proteínas, contribuindo na definição de assinaturas (tais como
impressões digitais) que caracterizam classes funcionais de proteínas. Como por exemplo, a
classe de receptores acoplados a proteína-G (GPCR) que representam uma das maiores famílias
no Genoma Humano. Esta família é um dos grandes alvos de pesquisa para a descoberta
e desenvolvimento de novas drogas, conseqüentemente, de grande interesse para a indústria
farmacêutica. O modelo proposto nesta dissertação combina máquinas de aprendizagem, como
SVM (Support Vector Machine) e MLP (Multilayer Perceptron), e métodos de descoberta de
padrões no desenvolvimento de um procedimento para predizer a relação entre uma seqüência
primária de proteínas e sua classe funcional. Como caso de estudo, este trabalho apresenta
experimentos com a superfamília GPCR, usando padrões em forma de expressões regulares
desta família extraídos pelo SPEXS (Sequence Pattern EXhaustive Search), um algoritmo para
descoberta de padrões