dc.contributor | Ochoa Luna, José Eduardo | |
dc.date.accessioned | 2017-08-10T17:27:09Z | |
dc.date.accessioned | 2023-05-30T23:26:39Z | |
dc.date.available | 2017-08-10T17:27:09Z | |
dc.date.available | 2023-05-30T23:26:39Z | |
dc.date.created | 2017-08-10T17:27:09Z | |
dc.date.issued | 2017 | |
dc.identifier | 1055563 | |
dc.identifier | http://repositorio.ucsp.edu.pe/handle/UCSP/15404 | |
dc.identifier.uri | https://repositorioslatinoamericanos.uchile.cl/handle/2250/6477234 | |
dc.description.abstract | El reconocimiento de entidades nombradas es una tarea relevante en el a´rea de Procesamiento de Lenguaje Natural, su funci´on es identificar entidades en textos para un idioma dado. El estudio de esta tarea se ha enfocado principalmente en el idioma ingl´es.
Recientes estudios en el idioma ingl´es han mostrado que utilizar caracter´ısticas no supervisadas tales como word embeddings mejoran el reconocimiento de entidades nombradas. En este trabajo se investiga si caracter´ısticas no supervisadas pueden mejorar la tarea de NER supervisado en el idioma espan˜ol. Para esto, se propone utilizar caracter´ısticas no supervisadas mediante word representations y colocaciones, as´ı como caracter´ısticas adicionales en un clasificador Conditional Random Field (CRF). Resultados experimentales (82.44% de F-score en el corpus CoNLL-2002) muestran que el enfoque propuesto, en particular cuando se utiliza cross-lingual word representations, es comparable a abordajes de aprendizaje profundo, actualmente el estado del arte para NER en espan˜ol. | |
dc.language | spa | |
dc.publisher | Universidad Católica San Pablo | |
dc.publisher | PE | |
dc.rights | https://creativecommons.org/licenses/by/4.0/ | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.source | Universidad Católica San Pablo | |
dc.source | Repositorio Institucional - UCSP | |
dc.subject | Procesamiento de lenguaje natural | |
dc.subject | NER para español | |
dc.subject | Conditional Random Fields | |
dc.subject | Word embeddings | |
dc.title | Reconocimiento de entidades nombradas para el idioma español utilizando Conditional Random Fields con características no supervisadas | |
dc.type | info:eu-repo/semantics/masterThesis | |