Objeto de conferencia
Construcción de un índice de genes con anotaciones funcionales consistentes para la interpretación de experimentos de expresión génica en girasol
Autor
Fernández, Paula
Soria, Marcelo
Príncipi, Darío
González, S.
Lew, Sergio
Heinz, Ruth
Paniego, Norma
Institución
Resumen
Los proyectos genómicos desarrollados durante la última década han incrementado exponencialmente el número de secuencias disponibles en bases de datos públicas tanto de genomas completos como de ESTs, incluido el girasol. Para esta especie se dispone de más de 130.000 secuencias en GenBank, y existen pocos estudios desarrollados y disponibles para determinar la identidad funcional de dichas secuencias. Dado que esta información es clave para interpretar los resultados de los análisis conducidos a nivel transcripcional, el objetivo de este trabajo es el análisis bioinformático de secuencias parciales expresadas (ESTs) que serán objeto de posteriores estudios de expresión génica para caracteres de importancia agronómica a partir del diseño de un microarreglo de oligonucleótidos. Para ello, inicialmente se realizó un proceso de depuración de EST, ensamblado, anotación y re-evaluación de contigs para filtrar aquellos que presentaban redundancia y podrían conducir a la observación de patrones de expresión difíciles de interpretar durante el análisis del microarreglo. De manera exploratoria, se analizó un subconjunto de unigenes a través de un análisis de expresión digital diferencial a partir de la abundancia de transcriptos correspondientes presentes en diferentes clonotecas, para evaluar de manera preliminar la información contenida en el chip de girasol. Los resultados de estos análisis tendrán impacto en el conocimiento de expresión diferencial de posibles genes que serán genuinamente validados a posteriori de manera experimental bajo la utilización de la micromatriz de Helianthus annuus L. sintetizada y en proceso de validación. Plant genome projects developed during the last decade allowed the exponentially increased of public sequences in web databases not only of whole-sequenced genomes but also ESTs sequence for different species, including sunflower. Although more than 130,000 public ESTs sequences are available in GenBank, there are few preliminary studies aimed to elucidate the functional identity of these anonymous sequences. Considering that this information is important to carry out robust interpretation of transcriptional studies, we propose to obtain a reliable set of sunflower unigenes by applying different bioinformatic cleaning procedures to public ESTs databases. This unigene data base represents the start point in the design of an oligonucleotide microarray for transcriptomic studies. As a preliminary exploratory assay, a subset of these unigenes derived from different cDNA libraries was analyzed using automatic annotation methodologies and a digital expression analysis was conducted. The outcome results will help to have additional information about the data contained in the unigene database for further application to Helianthus annuus L transcriptomic analysis using an oligonucleotide microarray which is already printed and synthesized and in the process of validation. Sociedad Argentina de Informática e Investigación Operativa