info:eu-repo/semantics/doctoralThesis
Ordenamiento basado en ejemplos para la recuperación de información geográfica
Autor
ESAU VILLATORO TELLO
Resumen
problem of dealing with the excess of information. Web’s search machines are
convincing examples of their utility and popularity. Hence, Web’s users see the task
of information retrieval as an everyday activity. Search machines are employed to
find information about almost every area of knowledge. However, a considerable part
of this information is known to be geographically delimited, that is, in their content
refers to some spatial aspects, or some geographical places (for instance, names of
cities, countries, towns or streets, etc.). As a consequence of this fact, users looking for
this type of information tends to include in their queries some geographical references
when they are doing some search in the Web.
In this work we focus on this particular type of queries, this is, users looking
for apartments, hotels, restaurants, archeological information, touristic activities, industrial
places, interchange universities, etc. This problem is known as Geographic
Information Retrieval.
Recent research in the area of Geographic Information Retrieval (GIR) has shown
that the problem is partially solved through traditional Information Retrieval (IR)
techniques. It has been possible to observe that traditional IR machines are able to
retrieve the majority of relevant documents to some geographical queries; however,
these IR machines are not capable of generating a pertinent ranking of retrieved
documents, which turns out into a bad system performance. One of the main reasons
for the inappropriate ranking is the lack of information in the given query. For this
reason many research groups have tried to fill this lack of information employing
robust geographical resources (e.g., geographic ontologies), while some others have
tried to do the same by means of query reformulation strategies via relevance feedback.
As an alternative, in this work we propose a strategy for re-ranking the output of
GIR systems. Given that retrieving relevant documents to geographic queries seems
to be a minor problem for traditional IR machines, our work focuses on the problem
of improving the initial ranking of a set of documents by employing information obtained
through a relevance feedback process, i.e., re-ranking via relevance feedback.
Additionally, since geographic queries tend to include implicit information requirements,
we propose the use of complete documents instead of isolated terms to perform
the process of re-ranking; such documents are called example documents. Las técnicas de recuperación de información actuales representan un avance importante
para tratar con el problema del exceso de información. Los motores de búsqueda
en la Web son ejemplos convincentes de su utilidad y popularidad. Gracias a esto,
para los usuarios de la Web, la tarea de recuperación de información se ha vuelto una
actividad cotidiana. Los motores de búsqueda son utilizados para localizar información referente a casi todos los dominios del conocimiento humano. Ahora bien, gran
parte de toda esta información está acotada o es considerada como perteneciente a
un espacio geográfico, es decir, en su interior, se hace referencia a diferentes aspectos
espaciales y/o datos geográficos, como consecuencia muchos usuarios especifican una
referencia geográfica (nombre de una ciudad, provincia, avenida, etc.) como parte de
su consulta al buscador.
Dentro de esta tesis nos enfocaremos en el manejo de este tipo de consultas, por
ejemplo, usuarios buscando departamentos en renta, reservación de hoteles, restaurantes,
información sobre sitios arqueológicos, atractivos turísticos, sitios industriales,
universidades, etc. Problema que intenta resolver un área conocida como Recuperación de Información Geográfica (GIR).
Avances recientes en el área de recuperación de información geográfica han mostrado
que el problema está parcialmente resuelto a través de técnicas tradicionales de
recuperación de información (IR). Se ha podido observar que maquinas tradicionales
de IR son capaces de recuperar la mayoría de los documentos relevantes para la mayor
parte de las consultas geográficas, sin embargo, presentan dificultades al momento de
generar un orden pertinente de los documentos recuperados, lo cual resulta en un
desempeño deficiente. Una de las razones por las que el ordenamiento es inapropiado
es la falta de información en la consulta. Es por esta razón que grupos de investigación
han tratado de cubrir esta falta de información empleando recursos geográficos robustos
(e.g. ontologías geográficas), mientras que algunos otros grupos de investigación
lo han intentado por medio de estrategias de reformulación de consultas a través de
técnicas de retroalimentación de relevancia.
Como una alternativa, en este trabajo proponemos una estrategia reordenamiento
para sistemas GIR.
Materias
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
Compendio de innovaciones socioambientales en la frontera sur de México
Adriana Quiroga -
Caminar el cafetal: perspectivas socioambientales del café y su gente
Eduardo Bello Baltazar; Lorena Soto_Pinto; Graciela Huerta_Palacios; Jaime Gomez -
Material de empaque para biofiltración con base en poliuretano modificado con almidón, metodos para la manufactura del mismo y sistema de biofiltración
OLGA BRIGIDA GUTIERREZ ACOSTA; VLADIMIR ALONSO ESCOBAR BARRIOS; SONIA LORENA ARRIAGA GARCIA