doctoralThesis
Genómica y transcriptómica de la madurez del fruto de tomate: aplicaciones en el mejoramiento genético
Genomic and transcriptomic of the tomato fruit ripening: application to plant breeding
Autor
Cacchiarelli, Paolo
Institución
Resumen
El tomate cultivado (Solanum lycopersicum L.) es una de las Solanáceas de mayor
importancia económica. La superficie cultivada dedicada a este cultivo se distribuye en gran
parte del territorio a nivel global. Uno de los destinos de su producción es el de consumo en
fresco y un carácter de fundamental importancia es la prolongación de la vida poscosecha,
ya que las pérdidas poscosecha en los países en desarrollo representan casi el 50 % de lo
producido (Meli et al., 2010). Un grupo de proteínas denominadas small Heat Shock Proteins
(sHSPs) desempeñan diversas funciones de regulación en la maduración y por lo tanto
podrían extender la vida poscosecha. Es de destacar, que estas sHSPs interaccionan con la
fitohormona clave de los frutos climatéricos, el etileno. En esta tesis se abordó el estudio de
la participación de las sHSPs en el proceso de maduración del fruto de tomate a través de
enfoques transcriptómicos y genómicos, en el cual se desarrollaron marcadores moleculares
a partir de dicha información con el fin de obtener nuevas estrategias de mejoramiento
genético de la especie y asistir al programa de mejora. Se realizaron estudios
transcripcionales mediante secuenciación mediante tecnología Illumina® en el cv. Caimanta
(C), la accesión silvestre LA0722 (P) y su F1
(CxP) en los estados de maduración de Verde
Maduro (VM), Pinton (Pi) y Rojo Maduro (RM). En total se obtuvieron un promedio de
22.541.809 lecturas por cada biblioteca. Se detectaron genes con Expresión Diferencial (ED)
significativa entre los estados Pi vs. VM y RM vs. VM para los 3 genotipos considerados
uniformes de manera global. Se realizó una caracterización y análisis de la funcionalidad de
genes en donde se detectaron 4 términos GO de la ontología génica (GO, del inglés gene
ontology) relacionados a procesos biológicos en donde participan genes relacionados a la
maduración. Los ID de los genes en cada GO fueron identificados y comparados,
obteniendo un total de 2744 genes únicos entre ellos, evidenciando una gran riqueza en este
enfoque. A fin de refinar el análisis global de genes, se enfocó en la subfamilia de sHSPs
previamente estudiadas in silico. Se identificaron una decena de genes de sHSPs con
expresión diferencial en los progenitores y su cruzamiento. Siguiendo los análisis de las
sHSPs, se estudiaron aquellas detectadas previamente por Arce et al. (2015, 2016) y
Krsticevic et al. (2016). El gen Solyc06g076540.1 se destacó por su mayor expresión
diferencial y significancia entre los estados madurativos. Con el fin de detectar efectos
genéticos a través de estudios de expresión entre los progenitores se realizaron
comparaciones de los transcriptomas en el mismo estado de maduración (C vs P para VM,
C vs P para Pi y C vs P para RM). Esto evidenció que la sHSPs Solyc06g076540.1 mantuvo
una expresión diferencial constante en los 3 estados. A partir de esta información del
análisis transcriptómico y genómico se desarrollaron 3 InDels y 1 SNP a través del
polimorfismo detectado en las secuencias génicas de los progenitores. El enfoque genómico
se desarrolló con tecnología de secuenciación de segunda y tercera generación. Se realizó
la caracterización fenotípica y molecular de la población F4 obtenida del cruzamiento
ToUNR18 x ToUNR1. En la caracterización fenotípica se analizaron caracteres morfológicos
y organolépticos. Los resultados de los caracteres morfológicos mostraron h
2 altas (mayores
a 0,72) excepto para vida poscosecha que tuvo un valor intermedio (0,46). Por el lado de los
caracteres organolépticos fue de medio a bajo (0,33 fue el máximo para dureza). Se
caracterizó molecularmente una generación F4 con InDels y SNP desarrollados y se
detectaron QTLs robustos para peso, altura y pH. Por último, con el fin de relevar la región
de estas sHSPs del cromosoma 6 con mayor certidumbre se realizó una secuenciación de la
región en la plataforma ONT (del inglés, Oxford Nanopore Technologies) de secuenciación
de tercera generación. Estudios in silico previos del grupo habían sugerido una variación en
el número de copias de estas sHSPs que podrían distorsionar los análisis de expresión
diferencial e intervenir en el proceso de maduración. Esta tecnología es capaz de reducir
fuertemente las dificultades del ensamblaje en regiones repetitivas y duplicadas en tándem.
Se desarrollaron 27 pares de cebadores para amplificar dicha región y se secuenció los
genotipos C, P y su F1
. Se lograron secuencias con longitudes entre 400 pb y 6000 pb. Se
ensambló la región y se obtuvieron 2 contigs para el cv. Caimanta sumando un total de
12011 pb, la accesión silvestre LA0722 obtuvo 3 contigs con una longitud de 10006 pb y la
F1 4 contigs con un total de 13945 pb. Los resultados obtenidos permiten disponer de
secuencia genómica más confiable a nivel de regiones con genes duplicados en tándem o
regiones repetitivas con el fin de continuar con el desarrollo de marcadores moleculares que
asistan al programa de mejora. Integrar la información transcriptómica mediante un enfoque
basado en el conocimiento de la secuencia genómica permite estudiar posibles genes
candidatos implicados en la determinación de los rasgos agronómicos de interés y así
obtener nuevas variedades con larga vida poscosecha a través del mejoramiento genético
de la especie. Tomato (Solanum lycopersicum L.) is one of the most economically important
Solanaceae. An important trait is the prolongation of post-harvest life since postharvest
losses in developing countries represent 50% of production. The small Heat Shock Proteins
(sHSP) gene family shows a high copy number of members, involved in stress and ripening
processes. We have studied the genomic structure and function of sHSP subfamily members
in Solanum lycopersicum cv. Caimanta, Solanum pimpinellifolium accession LA0722 and
their F1
, which are the parental lines of different breeding populations. The goal was to study
the participation of sHSPs in the fruit ripening process and develop new strategies for genetic
breeding. Transcriptomes were obtained in cv. Caimanta (C), the wild accession LA0722 (P)
and its F1
(CxP) at the mature green (MG), breaker (B) and red ripe (RR), main ripening
stages. For C, 6159 and 6922 genes with differential gene expression (DGE) were detected
between B vs MG and RR vs MG respectively, in P there were 7313 and 6929 genes with
differential gene expression (DGE) were detected between B vs MG and RR vs MG
respectively, and for the F1
it was 2715 and 6994 genes with differential gene expression
(DGE) were detected between B vs. MG and RR vs. MG respectively. Gene functionality
analysis was performed and 4 Gene Ontology (GO) terms were detected. We identified 10
sHSP genes with DGE in C, 5 genes only in the RR state and 5 shared between the B and
RR states. In P there were a total of 6 sHSP genes with DGE, detecting 4 shared genes
between both states, and a unique gene in B and RR. Three InDels and a SNP were
developed through the polymorphism detected in genome sequences of parental genotypes
and a segregating population (F4
) was molecularly characterized. We have identified three
Quantitative Trait Loci (QTL) for weight, height, and pH, respectively. Previous studies
evidenced variation in the copy numbers of sHSP in chr06. This region was sequenced using
3
rd generation technology. The region was assembled and we obtained 2 contigs for cv.
Caimanta, 3 contigs for wild accession and 4 contigs for F1
. Results obtained allowed
integrating the information from the transcriptomic study with an approach based on the
knowledge of the genomic sequence and thus developing molecular markers that allow
assisting the genetic improvement of the species to obtain new elite varieties. Fil: Apellido, Nombre. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; Argentina Fil: Cacchiarelli, Paolo. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; Argentina