Trabajo de grado - Maestría
Modelo predictivo de zonas de riesgo espacio temporal de accidentes de tráfico en la ciudad de Manizales
Registro en:
Universidad de Caldas
Repositorio Institucional Universidad de Caldas
Autor
Cardona Álvarez, Juan Camilo
Institución
Resumen
Ilustraciones, mapas spa:Los accidentes de tráfico representan una preocupación crucial para las autoridades gubernamentales a nivel mundial, ya que buscan reducir la pérdida de vidas y daños materiales. En Manizales, Colombia, los accidentes de tráfico son la tercera causa principal de muerte, después de los homicidios y suicidios. La predicción del riesgo de accidentes con alta resolución espacio-temporal es un desafío significativo, principalmente debido al complejo entorno de tráfico, el comportamiento humano y la falta de datos en tiempo real. A pesar de que las técnicas de aprendizaje automático han mostrado mejoras notables en la predicción en comparación con los modelos tradicionales, aún existen dificultades para aplicar estas técnicas en países como Colombia, donde la infraestructura y la disponibilidad de datos no siempre son óptimas. En este estudio, se propone utilizar múltiples técnicas de aprendizaje automático para mejorar la precisión de las predicciones. Estas técnicas incluyen enfoques basados en series temporales, como Facebook Prophet, así como algoritmos más avanzados, como Light Gradient Boosting y redes neuronales recurrentes, específicamente Long Short-Term Memory (LSTM). Estas técnicas se seleccionan en base a su capacidad demostrada en el estado del arte y su capacidad para procesar datos y aprender patrones. Para llevar a cabo esta investigación, se construyen modelos para toda la ciudad y cada zona utilizando datos de 18 años en general y de 7 años por zonas, lo que permite obtener un panorama amplio y detallado del comportamiento de los accidentes de tráfico en la ciudad. Se analiza el desempeño de cada modelo en función de su capacidad para predecir accidentes, y se selecciona el mejor modelo para cada zona. Con el fin de evaluar el rendimiento de los modelos y la precisión de las predicciones, se emplean las métricas MAPE y RMSE, que son ampliamente utilizadas en el campo de la predicción y permiten una comparación efectiva entre diferentes técnicas y enfoques. Los resultados muestran el MAPE y el RMSE para cada zona con cada modelo y en diferentes horizontes temporales, incluyendo predicciones diarias, semanales, entre semana, fines de semana, quincenales y mensuales. Finalmente, tras la aplicación de los algoritmos en distintas zonas y horizontes temporales de predicción, se observa que no existe un algoritmo claramente superior a los demás. Por lo tanto, se concluye que, al realizar las predicciones, se puede utilizar el algoritmo que presente el mejor desempeño según la zona y el horizonte temporal en cuestión. eng:Traffic accidents represent a critical concern for governmental authorities worldwide as they strive to reduce loss of life and material damages. In Manizales, Colombia, traffic accidents are the third leading cause of death, following homicides and suicides. Predicting accident risk with high spatiotemporal resolution poses a significant challenge, primarily due to the complex traffic environment, human behavior, and lack of real-time data. Although machine-learning techniques have demonstrated notable improvements in prediction compared to traditional models, there are still difficulties in applying these techniques in countries like Colombia, where infrastructure and data availability are not always optimal. This study proposes multiple machine learning techniques for predicting traffic accidents in Manizales, Colombia, ranging from time-series-based approaches like Facebook Prophet to more advanced algorithms such as Light Gradient Boosting and recurrent neural networks, specifically Long Short Term Memory (LSTM). These methods seek to leverage data processing capabilities and learning patterns to enhance prediction accuracy. To conduct this research, models are constructed for the entire city and each zone using 18 years of general data and 7 years of data per zone, providing a comprehensive and detailed view of traffic accident behavior in the city. Each model's performance is analyzed based on its ability to predict accidents, and the best model for each zone is selected. To evaluate the models' performance and the accuracy of the predictions, the MAPE and RMSE metrics are employed, which are widely used in the prediction field and allow for effective comparisons between different techniques and approaches. The results display the MAPE and RMSE for each zone with each model and across different temporal horizons, including daily, weekly, weekdays, weekends, fortnightly, and monthly predictions. Finally, conclusions and recommendations for taking action in future work are presented, which could lead to additional aspects for predicting traffic accidents and ultimately save lives and reduce material damages. RESUMEN / ABSTRACT / CONTENIDO / Lista de figuras / Lista de tablas / 1. INTRODUCCIÓN / 1.1 Planteamiento del problema / 1.2 Justificación / 1.3 Objetivos / 1.3.1 Objetivo general / 1.3.2 Objetivos específicos / 2. MARCO DE REFERENCIA / 2.1 Análisis de big data / 2.2 Análisis predictivo / 2.3 Aplicación de técnicas para el análisis predictivo / 2.4 Predicción con series de tiempo / 2.5 Predicción de accidentes / 2.6 Predicción de accidentes espacio – temporales / 2.7 Estado del arte de las predicciones espacio-temporales de accidentes de tránsito / 2.8 Trabajo Desarrollado / 3. METODOLOGÍA / 3.1 Recolección y entendimiento / 3.2 Tratamiento de datos / 3.3 Descripción detallada del proceso /3.3.1 Implementación Facebook Prophet / 3.3.2 Implementación Light Gradient Boosting. / 3.3.3 Implementación redes neuronales artificiales recurrentes - LSTM. / 4. RESULTADOS / 4.1 Resultados Facebook Prophet / 4.2 Resultados Light Gradient Boosting / 4.3 Resultados redes neuronales artificiales recurrentes – LSTM / 4.4 Dashboard Accidentes en la ciudad de Manizales / 5. CONCLUSIONES Y RECOMENDACIONES / 5.1 Conclusiones / 5.2 Recomendaciones / 6. BIBLIOGRAFIA / 7. ANEXOS / 7.1 Modelo construido / 7.1.1 Entorno y librerías / 7.1.2 Preprocesamiento de los datos / 7.1.3 Implementación de los algoritmos de predicción Maestría Magister en Ingeniería Computacional Inteligencia Artificial y Big Data, gestión y analítica de datos e inteligencia de negocios.