bachelorThesis
Análisis de algoritmos de Clustering basados en particionamiento y basados en Densidad para el procesamiento de trayectorias GPS.
Fecha
2020-10-08Autor
Puga Reyes, Eduardo Xavier
Institución
Resumen
Los constantes avances en técnicas de registro y recolección de información de
trayectorias GPS, el incremento en la cantidad de dispositivos que recolectan este tipo
de información como las cámaras de video, sensores de tráfico, teléfonos inteligentes,
etc, origina un gran volumen de información. El poder identificar patrones realizando
un análisis inteligente de estos datos es un área en dónde hoy muchos investigadores
realizan esfuerzos para identificar soluciones. Las técnicas de agrupamiento de
trayectorias GPS permiten identificar patrones sobre grandes volúmenes de datos. Esta
tesis presenta una evaluación de dos de los algoritmos de clustering tradicionales
Kmeans y DBscan que fueron adaptados para el procesamiento de trayectorias GPS,
incorporando una segmentación de las trayectorias basada en ángulo y una selección de
centroides iniciales 4k, 8k y 12 k. Los resultados obtenidos luego de aplicar el método
propuesto sobre tres bases de datos de trayectorias reales son satisfactorios y muestran
una mejor calidad de agrupamiento al comparar los índice Silhouette y Distancia
Promedio al Individuo más cercano. The constant advances in techniques for recording and collecting information on GPS
tracks, the increase in the number of devices that collect this type of information such
as video cameras, traffic sensors, smartphones, etc., originates a large volume of
information. Being able to identify patterns by performing an intelligent analysis of this
data is an area where today many researchers make efforts to identify solutions. GPS
track clustering techniques allow patterns to be identified over large volumes of data.
This thesis presents an evaluation of two of the traditional clustering algorithms
Kmeans and DBscan that were adapted for the processing of GPS trajectories,
incorporating a segmentation of the trajectories based on angle and a selection of initial
centroids 4k, 8k and 12 k. The results obtained after applying the proposed method on
three databases of real trajectories are satisfactory and show a better quality of grouping
when comparing the Silhouette and Average Distance indices to the closest individual.