Trabajo de grado - Maestría
Extracción y análisis de información de accidentes de tránsito desde redes sociales
Fecha
2021Registro en:
Universidad Nacional de Colombia
Repositorio Institucional Universidad Nacional de Colombia
Autor
Suat Rojas, Nestor Eduardo
Institución
Resumen
La detección de accidentes de tránsito es una estrategia importante para que los gobiernos implementen políticas que reduzcan este fenómeno. Usualmente usan técnicas como procesamiento de imágenes, dispositivos RFID, y otras. La detección en redes sociales ha surgido como una alternativa de bajo costo. Sin embargo las redes sociales presentan varios retos y desafíos como uso de lenguaje informal y falta de ortografía. Este trabajo propone un método para extraer y analizar los datos de accidentes de tránsito desde Twitter. Cuatro fases componen el método. La primera fase establece los mecanismos para obtener datos. El
segundo consiste en representar vectorialmente los mensajes y clasificarlos como accidentes
de tránsito o no. La tercera usa técnicas de reconocimiento de entidades nombradas para la detección de ubicaciones. En la cuarta estas ubicaciones pasan por un geocoder que devuelve sus coordenadas geográficas. Aplicamos este método para la ciudad de Bogotá y comparamos los datos de Twitter con la fuente oficial de tránsito, las comparaciones muestran una influencia en Twitter sobre la zona comercial e industrial de la ciudad. Los resultados revelan la efectividad de los accidentes reportados en Twitter como información adicional y su uso debe considerarse como fuentes complementarias a los métodos de detección existentes. (Texto tomado de la fuente) The detection of traffic accidents is an important strategy for governments to implement
policies that reduce this phenomenon. They usually use techniques like image processing,
RFID devices, and others. Social media detection has emerged as a low-cost alternative.
However, social media presents several challenges such as use of non-formal language and
misspelling. This work proposes a method to extract and analyze traffic accident data from
Twitter. The method is composed of four phases. The first phase establishes the mechanisms
for obtaining data. The second consists of representing the messages in vectors and classif-
ying them as traffic accidents or not. The third uses named entity recognition techniques for location detection. In the fourth, these locations go through a geocoder that returns their
geographic coordinates. We apply this method for the city of Bogota and compare the data
on Twitter with the official transit source, the comparisons show an influence on Twitter
on the commercial and industrial area of the city. The results reveal the effectiveness of the
accidents reported on Twitter as additional information and their use should be considered
as complementary sources to the existing detection methods.