Artículos de revistas
Recuperación de Información con Resolución de Ambigüedad de Sentidos de Palabras para el Español. Information Retrieval with Word Sense Disambiguation for Spanish
Information Retrieval with Word Sense Disambiguation for Spanish
Autor
GELBUKH, ALEXANDER
LEDO MEZQUITA, YOEL
SIDOROV, GRIGORI
Institución
Resumen
UNO DE LOS PROBLEMAS EN LOS PORTALES DE RECUPERACIÓN DE INFORMACIÓN EN INTERNET (LOS PORTALES DINÁMICOS DE ALTAVISTA, GOOGLE, YAHOO, ETC.) Y EN BIBLIOTECAS DIGITALES (BIBLIOTECA DEL CONGRESO DE LOS EE.UU., ETC.) ES EL DE BRINDAR DIVERSAS RESPUESTAS CON MUY BAJA PERTINENCIA. POR EJEMPLO, UN MECÁNICO DE AUTOS BUSCA ""¿DÓNDE COMPRAR UN GATO?"" Y OBTIENE RESPUESTAS SOBRE LOS ""GATOS MONTESES"", ""GATOS SIAMESES"", Y OTROS. UN COMERCIANTE DE FRUTAS BUSCA ""PRODUCCIÓN DE LIMA"" Y OBTIENE RESPUESTAS SOBRE LA ""CIUDAD DE LIMA"", ""JUGO DE LIMA"", ""LIMA DE UÑAS"", Y OTROS. ESTAS IMPRECISIONES SON DEBIDAS A LOS DISTINTOS SENTIDOS QUE TIENEN LAS PALABRAS, LO CUAL SE LE CONOCE COMO DESAMBIGUACIÓN DEL SENTIDO DE LAS PALABRAS (WORD SENSE DISAMBIGUATION, WSD, DEL INGLÉS.) ESTE TÉRMINO, ES UN MECANISMO LINGÜÍSTICO PARA DEFINIR EL SENTIDO CORRECTO DE UNA PALABRA, BASÁNDOSE EN EL CONTEXTO DONDE SE EMPLEE, EN FUNCIÓN DE SUS POSIBLES SENTIDOS SEMÁNTICOS. LAS APORTACIONES DE ESTE ARTÍCULO CONSISTEN EN EL DESARROLLO DE UN NUEVO MÉTODO DE DESAMBIGUACIÓN DE SENTIDOS DE PALABRAS USANDO GRANDES RECURSOS LÉXICOS (DICCIONARIOS EXPLICATIVOS, DICCIONARIOS DE SINÓNIMOS, WORDNET). ONE OF THE PROBLEMS OF INFORMATION RETRIEVAL IN INTERNET AND DIGITAL LIBRARIES IS LOW PRECISION: A HIGH NUMBER OF RETRIEVED DOCUMENTS OF LOW RELEVANCE. FOR EXAMPLE, A PERSON LOOKS FOR INFORMATION ABOUT JAGUARS (THE ANIMAL) AND THE DOCUMENTS RETRIEVED ARE ABOUT THE MODEL OF A CAR. THIS PROBLEM ARISES DUE TO AMBIGUITY OF DIFFERENT SENSES OF WORDS. THE TASK OF DETERMINING THE CORRECT INTERPRETATION OF A WORD IN ITS CONTEXT IS KNOWN AS WORD SENSE DISAMBIGUATION (WSD) TASK. IT EMPLOYS A LINGUISTIC MECHANISM THAT DETECTS THE MOST SUITABLE SENSE OF A WORD, ACCORDING TO THE CONTEXT WHERE THE WORD IS USED, CHOOSING OF ITS POSSIBLE SENSES. IN THIS PAPER, A NEW METHOD FOR WORD SENSES DISAMBIGUATION IS PROPOSED BASED ON ADDITIONAL LINGUISTIC INFORMATION FOR THE WORDS IN THE CONTEXT AVAILABLE FROM THE LARGE LEXICAL RESOURCES, LIKE EXPLANATORY DICTINARY, SYNONYM DICTIONARY, WORDNET.