Artículo de revista
Learning system of web navigation patterns through hypertext probabilistic grammars
Sistema de aprendizaje de patrones de navegación web mediante gramáticas probabilísticas de hipertexto
Registro en:
0122-6517, 2382-4700 electrónico
2382-4700
Corporación Universidad de la Costa
0122-6517
REDICUC - Repositorio CUC
Autor
Cortez Vasquez, Augusto
Institución
Resumen
One issue of real interest in the area of
web data mining is to capture users’ activities during
connection and extract behavior patterns that help define
their preferences in order to improve the design of
future pages adapting websites interfaces to individual
users. This research is intended to provide, first of all,
a presentation of the methodological foundations of the
use of probabilistic languages to identify relevant or
most visited websites. Secondly, the web sessions are
represented by graphs and probabilistic context-free
grammars so that the sessions that have the highest
probabilities are considered the most visited and most
preferred, therefore, the most important in relation to
a particular topic. It aims to develop a tool for processing
web sessions obtained from a log server represented
by probabilistic context-free grammars. Uno de los problemas que reviste real interés
en el área de minería de uso de la web es capturar las
actividades de los usuarios durante su conexión y extraer
patrones de comportamiento que permitan definir sus preferencias
con el fin de mejorar el diseño de futuras páginas
adaptando las interfaces de los sitios web a los usuarios
individuales., En esta investigación se pretende ofrecer en
primer lugar una presentación de los fundamentos metodológicos
del uso de lenguajes probabilísticos para identificar
sitios web más relevantes o visitados. En segundo lugar
se representa las sesiones web mediante grafos y gramáticas
libres de contexto probabilísticas de tal forma que las
sesiones que tengan mayor probabilidad son consideradas
las más visitadas o más preferidas, por tanto las más relevantes
en relación a un tópico determinado. Se pretende
desarrollar una herramienta para procesamiento de sesiones
web obtenidas a partir de log de servidor representado
mediante gramáticas probabilísticas libres de contexto.