Uruguay | Tesis de grado
dc.contributorEtcheverry, Mathías
dc.contributorWonsever, Dina
dc.contributorLee Gun Woo, Universidad de la República (Uruguay). Facultad de Ingeniería Gun Woo
dc.creatorLee, Gun Woo
dc.date.accessioned2020-07-15T14:57:43Z
dc.date.accessioned2022-10-28T20:02:22Z
dc.date.available2020-07-15T14:57:43Z
dc.date.available2022-10-28T20:02:22Z
dc.date.created2020-07-15T14:57:43Z
dc.date.issued2020
dc.identifierLee, G. Detección de hiperonimia en español con representaciones vectoriales de palabras [en línea] Tesis de grado. Montevideo : Udelar. FI. INCO, 2020.
dc.identifierhttps://hdl.handle.net/20.500.12008/24657
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/4978715
dc.description.abstractEn el presente trabajo se aborda la tarea de detección de hiperonimia en español de forma supervisada. La misma ha sido investigada en diferentes idiomas pero según nuestro conocimiento hay escasos recursos para el español. Por este motivo, en este proyecto se construye un conjunto de datos para la relación de hiperonimia en español. Para la construcción se utilizó WordNet e información extraída de corpus. Para mejorar la calidad de los datos obtenidos se aplicaron heurísticas de filtrado. Por otro lado se consideraron dos modelos de redes neuronales aplicados sobre representaciones vectoriales de las palabras: 1) modelo con concatenación de vectores y 2) modelo de order embedding de Vendrov et al. (2015). Ambos modelos son entrenados con el conjunto de hiperonimia construido. Para evitar el fenómeno de memorización léxica (Levy et al., 2015) y estudiar el comportamiento de los modelos en palabras que no han sido vistas durante el entrenamiento, se consideran dos formas de partir el conjunto de datos (en entrenamiento, validación y evaluación) según ocurran o no palabras en común entre las particiones. Como resultado se presenta un conjunto de datos para el entrenamiento supervisado de la relación de hiperonimia en español, con 106592 y 44960 instancias para los casos con y sin palabras en común, respectivamente. Los mejores resultados fueron obtenidos con el modelo de order embedding, dando un valor de 89,3% y 81,8% de medida F1 sobre las dos variantes del conjunto de datos anteriormente mencionadas.
dc.languagees
dc.publisherUdelar.FI
dc.rightsLicencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
dc.rightsLas obras depositadas en el Repositorio se rigen por la Ordenanza de los Derechos de la Propiedad Intelectual de la Universidad de la República.(Res. Nº 91 de C.D.C. de 8/III/1994 – D.O. 7/IV/1994) y por la Ordenanza del Repositorio Abierto de la Universidad de la República (Res. Nº 16 de C.D.C. de 07/10/2014)
dc.subjectHiperonimia
dc.subjectRepresentaciones vectoriales de las palabras
dc.subjectRedes neuronales artificiales
dc.titleDetección de hiperonimia en español con representaciones vectoriales de palabras
dc.typeTesis de grado


Este ítem pertenece a la siguiente institución