es | en | pt | fr
    • Presentación
    • Países
    • Instituciones
    • Participa
        JavaScript is disabled for your browser. Some features of this site may not work without it.
        Ver ítem 
        •   Inicio
        • Chile
        • Gobierno
        • ANID (Chile)
        • Ver ítem
        •   Inicio
        • Chile
        • Gobierno
        • ANID (Chile)
        • Ver ítem

        Diseño y desarrollo de un modelo de desambiguación léxica automática para el procesamiento del lenguaje natural

        Fecha
        2021
        Registro en:
        http://hdl.handle.net/10533/253059
        21160361
        https://repositorioslatinoamericanos.uchile.cl/handle/2250/4484308
        Autor
        González-Vergara, Carlos
        Periñán-Pascual, Carlos
        PONTIFICIA UNIVERSIDAD CATOLICA DE CHILE
        Institución
        • ANID (Chile)
        Resumen
        La presente investigación doctoral tiene como objetivo general desarrollar un modelo más robusto de medida para la similitud y relación semántica que los disponibles actualmente para resolver el problema de la desambiguación léxica automática, aplicado al procesamiento del lenguaje natural (PLN). Para esto, se realizó una revisión del fenómeno lingüístico de la ambigüedad léxica, junto con los métodos para la desambiguación léxica automática más representativos y que han sido aplicados en PLN: de relación semántica, de similitud semántica, y basados en conocimiento contextual. Luego se expuso una panorámica cronológica de la utilización del corpus en el análisis lingüístico, junto con una caracterización de los llamados recursos lingüísticos informatizados. Como aspecto central de la propuesta, se estableció una metodología para la aplicación de los subtipos generales de procesamiento de datos en aprendizaje automático, con sus respectivas tareas de procesamiento. Posteriormente se ejecutó un experimento de desambiguación léxica automática basado en el corpus SENSEVAL-3 (Evaluating Word Sense Disambiguation Systems), utilizando un método de aprendizaje automático supervisado. Este experimento permitió consolidar la metodología para la ejecución un nuevo experimento, diseñado a partir del montaje de un corpus basado en una submuestra de CODICACH (Corpus Dinámico del Castellano de Chile), que consideró unidades léxicas polisémicas seleccionadas desde la base de conocimiento FunGramKB. Posteriormente, se reportaron los resultados de los sistemas de desambiguación basados en aprendizaje automático, junto con las críticas al modelo. Este proceso permitió desarrollar un modelo de desambiguación léxica automática basado en una medida híbrida, y fundamentado tanto lingüística como estadísticamente en la interacción de dos enfoques de exploración taxonómica: distancia entre rutas y contenido de información, a través de la incorporación de FunGramKB como inventario de sentidos. En cuanto a la evaluación, la medida de similitud propuesta SIMhíbrida(ci, cj) logró resultados consistentemente eficientes desde un punto de vista lingüístico en el proceso de desambiguación léxica automática.
        Materias

        Mostrar el registro completo del ítem


        Red de Repositorios Latinoamericanos
        + de 8.000.000 publicaciones disponibles
        500 instituciones participantes
        Dirección de Servicios de Información y Bibliotecas (SISIB)
        Universidad de Chile
        Ingreso Administradores
        Colecciones destacadas
        • Tesis latinoamericanas
        • Tesis argentinas
        • Tesis chilenas
        • Tesis peruanas
        Nuevas incorporaciones
        • Argentina
        • Brasil
        • Colombia
        • México
        Dirección de Servicios de Información y Bibliotecas (SISIB)
        Universidad de Chile
        Red de Repositorios Latinoamericanos | 2006-2018
         

        EXPLORAR POR

        Instituciones
        Fecha2011 - 20202001 - 20101951 - 20001901 - 19501800 - 1900

        Explorar en Red de Repositorios

        Países >
        Tipo de documento >
        Fecha de publicación >
        Instituciones >

        Red de Repositorios Latinoamericanos
        + de 8.000.000 publicaciones disponibles
        500 instituciones participantes
        Dirección de Servicios de Información y Bibliotecas (SISIB)
        Universidad de Chile
        Ingreso Administradores
        Colecciones destacadas
        • Tesis latinoamericanas
        • Tesis argentinas
        • Tesis chilenas
        • Tesis peruanas
        Nuevas incorporaciones
        • Argentina
        • Brasil
        • Colombia
        • México
        Dirección de Servicios de Información y Bibliotecas (SISIB)
        Universidad de Chile
        Red de Repositorios Latinoamericanos | 2006-2018