Tesis
Mejorando el Contenido Textual de un Sitio Web a Través de la Identificación de sus Web Site Keywords
Autor
Fernández Jorquera, José Ignacio
Institución
Resumen
En esta memoria se presenta el desarrollo y aplicación de una metodología para la identificación de las palabras más importantes contenidas en un sitio web, desde el punto de vista del usuario que lo visita, también conocidas como “web site keywords”.
El diseño y construcción de un sitio web, es una tarea no trivial que requiere de la definición del contenido correcto y la estructura correcta del sitio para atraer y/o retener a sus eventuales visitantes.
Asumiendo que la estructura de hipervínculos de un sitio esté relativamente correcta, el problema a abordar es qué contenidos atraerán en mayor medida la atención de sus visitantes, es decir, que imágenes, sonidos, colores, textos, etc. motivarían a un usuario a visitar el sitio web.
Existe una estrecha relación entre la cantidad de visitas de un sitio y su éxito en la Web, por lo que asegurar un correcto contenido, implica mejorar las posibilidades de sobre vivencia del sitio en un mercado altamente competitivo como es el digital.
De todos los contenidos antes mencionados, en el presente trabajo de memoria se desarrolla un set de herramientas que junto con una metodología propuesta, permitirían analizar los textos de las páginas de un sitio web y en particular, las palabras que componen dichos textos con miras a detectar aquellas que atraen la atención del usuario.
El sitio web seleccionado para propósitos de experimentación y validación del trabajo debería ser complejo con respecto a varias características: número de visitas, actualización periódica y ser rico en contenido textual. La página web de un banco virtual Chileno (sin sucursales físicas y donde todas sus transacciones son realizadas electrónicamente) cumplió con dichos criterios.
Se logro finalmente realizar el proceso de identificación de las palabras según las preferencias de navegación de los usuarios, determinando cuales eran más relevantes según la importancia dada por el “peso de la palabra” y por su relación con la industria. Palabras como Crédito, Financiamiento, Ahorro fueron algunas de las detectadas en el proceso y se agruparon en torno usuarios agrupados por la aplicación de algoritmos de web mining.
La validación de las palabras encontradas, y de la metodología planteada, se realizó a través de un test de efectividad de las palabras claves detectadas, donde se consultó a usuarios de Internet y clientes de bancos cual era la relevancia de las palabras clave o web site keywords en los textos de las páginas del sitio web, corroborando la relevancia que tiene el uso de estas palabras en el contenido textual de las páginas web.
Se concluye el trabajo mostrando las posibilidades de mejora del sitio web tanto textuales, por la identificación de palabras a través de la metodología con técnicas de web mining, como mejoras estructurales detectadas en el transcurso del trabajo.