dc.contributorGUSTAVO RAMIREZ VALVERDE
dc.creatorEVELIO HERNANDEZ JUAREZ
dc.date2015
dc.date.accessioned2022-10-12T20:06:39Z
dc.date.available2022-10-12T20:06:39Z
dc.identifierhttp://hdl.handle.net/10521/2812
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/4128935
dc.descriptionTesis (Doctorado en Ciencias, especialista en Estadística).- Colegio de Postgraduados, 2015.
dc.descriptionPara organismos eucariontes, en un gen, además de las regiones codificantes de proteínas (exones) se encuentran regiones no codificantes conocidas como intrones. Existen diferentes enfoques para encontrar las fronteras entre intrones y exones, uno de ellos trata de distinguir cambios en la composición (proporción) de sus nucleótidos y en este contexto usar la segmentación recursiva basada en medidas de divergencia; en esta metodología se necesita definir un “umbral” (parámetro que sirve como criterio de parada). En este estudio se propone que la elección del umbral sea basada en la distribución Monte Carlo de la máxima divergencia, y que dicho umbral dependa del tamaño de la secuencia considerada. Bajo la misma perspectiva de encontrar diferencias en la proporción de nucleótidos dentro de las secuencias, se propone usar la búsqueda de puntos de cambio en datos categóricos. Para este fin se optó por la alternativa de reformular la búsqueda como un problema de selección de variables y para ello se usó LASSO Binomial. Usando secuencias simuladas para probar ambas metodologías se obtuvieron resultados, en términos de precisión, comparables con los de estudios existentes. _______________ TWO METHODS FOR THE PREDICTION OF INTRONS AND EXONS INTO A GENE. ABSTRACT: For eukaryotic organisms, within a gen in addition to protein coding regions (exons) there are noncoding regions know as introns. There are different approaches to find the boundaries between introns and exons, one of those tries to distinguish changes in the composition (proportion) of its nucleotides and in this context the recursive segmentation based on measures of divergence can be used. To implement this methodology a threshold (a parameter that serves as a stopping criterion) needs to be define. Here it is proposed that the choice of the threshold be through by Montecarlo distribution of the maximum divergence; moreover, that such the threshold depends on the size of the sequence under study. Under the same perspective of finding differences in the proportion of nucleotides within the sequences, the search of change points in categorical data can be used. For this purpose, the alternative of reformulating the search as a problem of selection of variables was used following the LASSO binomial. Simulated sequences were used to test both methods and results similar to those of previous studies were obtained.
dc.formatapplication/pdf
dc.languagespa
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightshttp://creativecommons.org/licenses/by-nc-nd/4.0
dc.subjectIntrones y exones
dc.subjectProporción de nucleótidos
dc.subjectMedidas de divergencia
dc.subjectSelección de variables
dc.subjectIntrons and exons
dc.subjectNucleotide proportion
dc.subjectDivergence measures
dc.subjectVariable selection
dc.subjectEstadística
dc.subjectDoctorado
dc.subjectinfo:eu-repo/classification/cti/1
dc.subjectinfo:eu-repo/classification/cti/12
dc.subjectinfo:eu-repo/classification/cti/1209
dc.titleDos métodos para la predicción de intrones y exones en un gen.
dc.typeinfo:eu-repo/semantics/doctoralThesis
dc.audiencegeneralPublic


Este ítem pertenece a la siguiente institución