dc.contributor | Priego, Belém;#0000-0003-3439-1081 | |
dc.contributor | PINTO AVENDAÑO, DAVID EDUARDO; 275110 | |
dc.creator | Zárate Barragán, César Antonio | |
dc.creator | Zárate Barragán, César Antonio | |
dc.date.accessioned | 2023-03-06T18:07:42Z | |
dc.date.accessioned | 2023-07-20T16:18:42Z | |
dc.date.available | 2023-03-06T18:07:42Z | |
dc.date.available | 2023-07-20T16:18:42Z | |
dc.date.created | 2023-03-06T18:07:42Z | |
dc.date.issued | 2022-09 | |
dc.identifier | http://hdl.handle.net/11191/9482 | |
dc.identifier | https://doi.org/10.24275/uama.6732.9482 | |
dc.identifier.uri | https://repositorioslatinoamericanos.uchile.cl/handle/2250/7718533 | |
dc.description.abstract | La finalidad de este trabajo es presentar una metodología que permita combinar las estrategias del Procesamiento del Lenguaje Natural (PLN) con la capacidad de selección de un algoritmo genético para crear un generador de frases automático. Partiendo de textos en el idioma español, siendo un corpus de naturaleza literaria, se propone la aplicación de las técnicas comunes de extracción, etiquetado y un taggeador de manera paralela con los procesos de búsqueda de soluciones que aportan los algoritmos genéticos. Las palabras obtenidas, por medio de las técnicas del PLN, son consideradas como aminoácidos, estos entran en el algoritmo genético y son recombinados según reglas sintácticas previamente configuradas dentro de su fitness. Las mezclas efectuadas por el algoritmo genético, generan hileras de aminoácidos, que pueden ser tomadas como proteínas o priones. Como resultado se generan las proteínas que son interpretadas como frases correctas desde su enfoque sintáctico, dejando el aspecto semántico para investigaciones a futuro. En este documento se describe la metodología propuesta para la generación de frases donde se menciona sobre como el uso de la frecuencia de ocurrencia de palabras es indispensable para la re formulación de frases, se mencionan los dos trabajos que fueron utilizados para los experimentos realizados. También se describen las fases que son requeridas para el procesamiento de las frases como la extracción de palabras, el pre-procesamiento de texto, el análisis de frecuencias, el etiquetado de las palabras, la necesidad de vincular un algoritmo genético para aplicar reglas gramaticales en la formación de frases, las características de los aminoácidos involucrados en las estrategias que aplica el algoritmo genético, la importancia de segmentar los genes para detectar repeticiones, el uso del fitness del algoritmo genético y los pasos por los que pasa dicho algoritmo para poder generar frases. Este trabajo toma la funcionalidad de un algoritmo genético considerando la estrategia de cruzamiento por medio de ruleta, las mutaciones múltiples y la selección de genes por medio del elitismo. Todas estas estrategias posteriormente validadas por su fitness que se encarga de detectar repeticiones en los genes, segmentando estos últimos en bloques para concretar dicha tarea. también se relacionan estos procedimientos con elementos biológicos conocidos como priones, los cuales son proteínas mal formadas que pueden generar afectaciones de salud en un organismo vivo. Los priones son comparados con la gramática que contienen las frases en un texto, con la intención de poder descartar todas aquellas frases que sean generadas por el algoritmo genético. Finalmente se muestran los experimentos realizados con los dos textos de entrada El Laberinto de la Soledad y El Sombrero de Tres Picos, junto con los resultados obtenidos en estas pruebas. Se agregan las conclusiones en donde se indica la importancia de contemplar el costo computacional necesario para la formación de frases y la discusión de resultados que muestra las limitaciones, fortalezas y aportaciones de este trabajo. | |
dc.language | spa | |
dc.publisher | Universidad Autónoma Metropolitana (México). Unidad Azcapotzalco. Coordinación de Servicios de Información. | |
dc.rights | http://creativecommons.org/licenses/by-nc-nd/4.0 | |
dc.rights | openAccess | |
dc.rights | Atribución-NoComercial-SinDerivadas | |
dc.title | Generador de frases estructuradas por medio de algoritmos genéticos, estructuras priónicas y estructuras proteínicas | |
dc.type | Tesis de maestría | |