dc.contributorMejia, Maria
dc.contributorPiensa (Categoría C)
dc.creatorCardona Álvarez, Juan Camilo
dc.date2023-07-13T19:45:57Z
dc.date2023-07-13T19:45:57Z
dc.date2023-07-13
dc.date.accessioned2023-09-06T18:34:56Z
dc.date.available2023-09-06T18:34:56Z
dc.identifierhttps://repositorio.ucaldas.edu.co/handle/ucaldas/19537
dc.identifierUniversidad de Caldas
dc.identifierRepositorio Institucional Universidad de Caldas
dc.identifierhttps://repositorio.ucaldas.edu.co/
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/8699552
dc.descriptionIlustraciones, mapas
dc.descriptionspa:Los accidentes de tráfico representan una preocupación crucial para las autoridades gubernamentales a nivel mundial, ya que buscan reducir la pérdida de vidas y daños materiales. En Manizales, Colombia, los accidentes de tráfico son la tercera causa principal de muerte, después de los homicidios y suicidios. La predicción del riesgo de accidentes con alta resolución espacio-temporal es un desafío significativo, principalmente debido al complejo entorno de tráfico, el comportamiento humano y la falta de datos en tiempo real. A pesar de que las técnicas de aprendizaje automático han mostrado mejoras notables en la predicción en comparación con los modelos tradicionales, aún existen dificultades para aplicar estas técnicas en países como Colombia, donde la infraestructura y la disponibilidad de datos no siempre son óptimas. En este estudio, se propone utilizar múltiples técnicas de aprendizaje automático para mejorar la precisión de las predicciones. Estas técnicas incluyen enfoques basados en series temporales, como Facebook Prophet, así como algoritmos más avanzados, como Light Gradient Boosting y redes neuronales recurrentes, específicamente Long Short-Term Memory (LSTM). Estas técnicas se seleccionan en base a su capacidad demostrada en el estado del arte y su capacidad para procesar datos y aprender patrones. Para llevar a cabo esta investigación, se construyen modelos para toda la ciudad y cada zona utilizando datos de 18 años en general y de 7 años por zonas, lo que permite obtener un panorama amplio y detallado del comportamiento de los accidentes de tráfico en la ciudad. Se analiza el desempeño de cada modelo en función de su capacidad para predecir accidentes, y se selecciona el mejor modelo para cada zona. Con el fin de evaluar el rendimiento de los modelos y la precisión de las predicciones, se emplean las métricas MAPE y RMSE, que son ampliamente utilizadas en el campo de la predicción y permiten una comparación efectiva entre diferentes técnicas y enfoques. Los resultados muestran el MAPE y el RMSE para cada zona con cada modelo y en diferentes horizontes temporales, incluyendo predicciones diarias, semanales, entre semana, fines de semana, quincenales y mensuales. Finalmente, tras la aplicación de los algoritmos en distintas zonas y horizontes temporales de predicción, se observa que no existe un algoritmo claramente superior a los demás. Por lo tanto, se concluye que, al realizar las predicciones, se puede utilizar el algoritmo que presente el mejor desempeño según la zona y el horizonte temporal en cuestión.
dc.descriptioneng:Traffic accidents represent a critical concern for governmental authorities worldwide as they strive to reduce loss of life and material damages. In Manizales, Colombia, traffic accidents are the third leading cause of death, following homicides and suicides. Predicting accident risk with high spatiotemporal resolution poses a significant challenge, primarily due to the complex traffic environment, human behavior, and lack of real-time data. Although machine-learning techniques have demonstrated notable improvements in prediction compared to traditional models, there are still difficulties in applying these techniques in countries like Colombia, where infrastructure and data availability are not always optimal. This study proposes multiple machine learning techniques for predicting traffic accidents in Manizales, Colombia, ranging from time-series-based approaches like Facebook Prophet to more advanced algorithms such as Light Gradient Boosting and recurrent neural networks, specifically Long Short Term Memory (LSTM). These methods seek to leverage data processing capabilities and learning patterns to enhance prediction accuracy. To conduct this research, models are constructed for the entire city and each zone using 18 years of general data and 7 years of data per zone, providing a comprehensive and detailed view of traffic accident behavior in the city. Each model's performance is analyzed based on its ability to predict accidents, and the best model for each zone is selected. To evaluate the models' performance and the accuracy of the predictions, the MAPE and RMSE metrics are employed, which are widely used in the prediction field and allow for effective comparisons between different techniques and approaches. The results display the MAPE and RMSE for each zone with each model and across different temporal horizons, including daily, weekly, weekdays, weekends, fortnightly, and monthly predictions. Finally, conclusions and recommendations for taking action in future work are presented, which could lead to additional aspects for predicting traffic accidents and ultimately save lives and reduce material damages.
dc.descriptionRESUMEN / ABSTRACT / CONTENIDO / Lista de figuras / Lista de tablas / 1. INTRODUCCIÓN / 1.1 Planteamiento del problema / 1.2 Justificación / 1.3 Objetivos / 1.3.1 Objetivo general / 1.3.2 Objetivos específicos / 2. MARCO DE REFERENCIA / 2.1 Análisis de big data / 2.2 Análisis predictivo / 2.3 Aplicación de técnicas para el análisis predictivo / 2.4 Predicción con series de tiempo / 2.5 Predicción de accidentes / 2.6 Predicción de accidentes espacio – temporales / 2.7 Estado del arte de las predicciones espacio-temporales de accidentes de tránsito / 2.8 Trabajo Desarrollado / 3. METODOLOGÍA / 3.1 Recolección y entendimiento / 3.2 Tratamiento de datos / 3.3 Descripción detallada del proceso /3.3.1 Implementación Facebook Prophet / 3.3.2 Implementación Light Gradient Boosting. / 3.3.3 Implementación redes neuronales artificiales recurrentes - LSTM. / 4. RESULTADOS / 4.1 Resultados Facebook Prophet / 4.2 Resultados Light Gradient Boosting / 4.3 Resultados redes neuronales artificiales recurrentes – LSTM / 4.4 Dashboard Accidentes en la ciudad de Manizales / 5. CONCLUSIONES Y RECOMENDACIONES / 5.1 Conclusiones / 5.2 Recomendaciones / 6. BIBLIOGRAFIA / 7. ANEXOS / 7.1 Modelo construido / 7.1.1 Entorno y librerías / 7.1.2 Preprocesamiento de los datos / 7.1.3 Implementación de los algoritmos de predicción
dc.descriptionMaestría
dc.descriptionMagister en Ingeniería Computacional
dc.descriptionInteligencia Artificial y Big Data, gestión y analítica de datos e inteligencia de negocios.
dc.formatapplication/pdf
dc.formatapplication/pdf
dc.formatapplication/pdf
dc.formatapplication/pdf
dc.languageeng
dc.languagespa
dc.publisherFacultad de Ingeniería
dc.publisherManizales
dc.publisherMaestría en Ingeniería Computacional
dc.relationAlver, Y., Onelcin, P., Cicekli, A., & Abdel-Aty, M. (2021). Evaluation of pedestrian critical gap and crossing speed at midblock crossing using image processing. Accident Analysis & Prevention, 156, 106127. doi:https://doi.org/10.1016/j.aap.2021.106127
dc.relationAmiri, A. M., Nadimi, N., Khalifeh, V., & Shams, M. (2021). GIS-based crash hotspot identification: a comparison among mapping clusters and spatial analysis techniques. International journal of injury control and safety promotion, 1-14.
dc.relationBanker, S. (2016). A New Big Data Predictive Analytics Solution For Ocean Carriers.
dc.relationBao, J., Liu, P., & Ukkusuri, S. V. (2019). A spatiotemporal deep learning approach for citywide short-term crash risk prediction with multi-source data. Accident Analysis & Prevention, 122, 239-254.
dc.relationBao, W., Yu, Q., & Kong, Y. (2020). Uncertainty-based traffic accident anticipation with spatiotemporal relational learning. Paper presented at the Proceedings of the 28th ACM International Conference on Multimedia.
dc.relationBetancourt, G. A. (2005). Las máquinas de soporte vectorial (SVMs). Scientia et technica, 1(27).
dc.relationBM. (2018). Las muertes y lesiones causadas por accidentes de tránsito frenan el crecimiento económico de los países en desarrollo. Retrieved from https://www.bancomundial.org/es/news/press-release/2018/01/09/road-deaths-andinjuries-hold-back-economic-growth-in-developing-countries
dc.relationBM. (2021). Ingreso mediano alto. Retrieved from https://datos.bancomundial.org/nivel-deingresos/ingreso-mediano-alto
dc.relationBrownlee, J. (2020). Data preparation for machine learning: data cleaning, feature selection, and data transforms in Python: Machine Learning Mastery.
dc.relationCaparrós, A. E. (1999). El comportamiento humano en conducción: factores perceptivos, cognitivos y de respuesta. Cognición y Psicología Aplicada a la conducción de vehículos.
dc.relationCavanillas, J. M., Curry, E., & Wahlster, W. (2016). New horizons for a data-driven economy: a roadmap for usage and exploitation of big data in Europe: Springer Nature.
dc.relationChaturvedi, S., Rajasekar, E., Natarajan, S., & McCullen, N. (2022). A comparative assessment of SARIMA, LSTM RNN and Fb Prophet models to forecast total and peak monthly energy demand for India. Energy Policy, 168, 113097
dc.relationChen, L., Jia, Y., Sellis, T., & Liu, G. (2014). Big Data Cleaning. En: Web Technologies and Applications: 16th Asia-Pacific Web Conference, APWeb 2014, Changsha, China, September 5-7, 2014. Proceedings (Vol. 8709): Springer.
dc.relationChen, M., Mao, S., & Liu, Y. (2014). Big Data: A Survey. Mobile Networks and Applications, 19(2), 171-209. doi:10.1007/s11036-013-0489-0
dc.relationChollet, F. (2021). Deep learning with Python: Simon and Schuster.
dc.relationClifton, C., & Thuraisingham, B. (2001). Emerging standards for data mining. Computer Standards & Interfaces, 23(3), 187-193.
dc.relationCukier, K. (2010). Data, data everywhere. Economist, 394(8671), 3-5.
dc.relationDabiri, S., & Heaslip, K. (2018). Inferring transportation modes from GPS trajectories using a convolutional neural network. Transportation research part C: emerging technologies, 86, 360-371.
dc.relationDANE. (2019). Resultados Censo Nacional de Población y Vivienda 2018. Retrieved from https://www.dane.gov.co/files/censo2018/informacion-tecnica/presentacionesterritorio/191019-CNPV-presentacion-Caldas-Manizales.pdf
dc.relationde Medrano, R., & Aznarte, J. L. (2021). A New Spatio-Temporal Neural Network Approach for Traffic Accident Forecasting. Applied Artificial Intelligence, 1-20.
dc.relationDíaz Fuentes, D. (2014). Transporte y logística en la economía mundial.
dc.relationDominguez Márquez, C., López Castro, A., & González, J. O. (2004). Lesiones anatómicas y factores relacionados con muertes de ciclistas en accidentes de transporte. Bogotá, 2004. Revista de la Facultad de Medicina, 55(1), 14-23.
dc.relationDommelen, T. v. (2021). Hotel room demand forecasting: time series forecasting using SARIMA, LSTM and Prophet. ETSI_Informatica.
dc.relationFerro, C., Celis Mayorga, N., & Casallas García, A. (2020). Llenado de series de datos de 2014 a 2019 de PM2.5 por medio de una red neuronal y una regresión lineal
dc.relationFranco-Bedoya, O., Ameller, D., Costal, D., & Franch, X. (2017). Open source software ecosystems: A Systematic mapping. Information and Software Technology, 91, 160-185.
dc.relationGandomi, A., & Haider, M. (2015). Beyond the hype: Big data concepts, methods, and analytics. International journal of information management, 35(2), 137-144.
dc.relationGartner. (2012). Gartner Glossary. Retrieved from https://www.gartner.com/en/informationtechnology/glossary/big-data
dc.relationHowarth, B. (2014). Big data: how predictive analytics is taking over the public sector. The Guardian, 13, 2014.
dc.relationHyndman, R. J., & Koehler, A. B. (2006). Another look at measures of forecast accuracy. International journal of forecasting, 22(4), 679-688.
dc.relationIBM. (2010). Bancolombia strengthens anti-money-laundering capabilities with Predictive Analytics.
dc.relationIBM. (2020). IBM netfinity predictive failure analysis. Retrieved from http://ps2.kev009.com/pccbbs/pc_servers/pfaf.pdf
dc.relationINMLCF. (2019). Versión Web de Cifras de Lesiones de Causa Externa en Colombia 2019. Retrieved from https://www.medicinalegal.gov.co/cifras-estadisticas/forensis
dc.relationIntegra. (2021). Ventajas y Desventajas de la Inteligencia Artificial en Empresas. Retrieved from https://nexusintegra.io/es/ventajas-y-desventajas-de-la-inteligencia-artificial/
dc.relationJoel R. Spiegel, M. T. M., Girish S. Lakshman,Paul G. Nordstrom. (2004). United States Patent No.: A. T. Inc
dc.relationKingma, D. P., & Ba, J. (2014). Adam: A method for stochastic optimization. arXiv preprint arXiv:1412.6980.
dc.relationLaney, D. (2001). 3D data management: Controlling data volume, velocity and variety. META group research note, 6(70), 1.
dc.relationLeCun, Y., Bottou, L., Bengio, Y., & Haffner, P. (1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11), 2278-2324.
dc.relationLi, Z., Wang, W., Liu, P., Bigham, J. M., & Ragland, D. R. (2013). Using geographically weighted Poisson regression for county-level crash modeling in California. Safety science, 58, 89-97.
dc.relationLiu, M., Wu, J., Wang, Y., & He, L. (2018). Traffic flow prediction based on deep learning. Journal of System Simulation, 30(11), 4100.
dc.relationMills, S., Lucas, S., Irakliotis, L., Rappa, M., Carlson, T., & Perlowitz, B. (2012). Demystifying big data: a practical guide to transforming the business of government. TechAmerica Foundation, Washington.
dc.relationMoher, D., Liberati, A., Tetzlaff, J., Altman, D. G., & Group, P. (2009). Preferred reporting items for systematic reviews and meta-analyses: the PRISMA statement. PLoS medicine, 6(7), e1000097.
dc.relationNyce, C. (2007). Predictive Analytics White Paper, sl: American Institute for Chartered Property Casualty Underwriters. Insurance Institute of America, 1.
dc.relationOngsulee, P., Chotchaung, V., Bamrungsi, E., & Rodcheewit, T. (2018). Big data, predictive analytics and machine learning. Paper presented at the 2018 16th International Conference on ICT and Knowledge Engineering (ICT&KE).
dc.relationOrea, S. V., Vargas, A. S., & Alonso, M. G. (2005). Minería de datos: predicción de la deserción escolar mediante el algoritmo de árboles de decisión y el algoritmo de los k vecinos más cercanos. Ene, 779(73), 33.
dc.relationOussous, A., Benjelloun, F., Ait, A., & Belfkih, S. (2017). Big data technologies: A survey Journal of King Saud University-Computer and Information Sciences. em></p, 01-18.
dc.relationPavlyuchenko, K., Panfilov, P., & Gorshkov, G. (2021). EXPLORING THE CAPABILITIES OF PREDICTIVE DATA ANALYTICS IN FMCG INDUSTRY. Infokommunikacionnye tehnologii, 19(4), 439-454.
dc.relationPérez, M. (2015). BIG DATA-Técnicas, herramientas y aplicaciones: Alfaomega Grupo Editor.
dc.relationPortafolio. (2020). Siniestros viales le cuestan al país 23,9 billones de pesos al año. Portafolio. Retrieved from https://www.portafolio.co/economia/a-octubre-en-colombia-fallecieron4-156-personas-en-siniestros-viales-546657
dc.relationPusala, M. K., Salehi, M. A., Katukuri, J. R., Xie, Y., & Raghavan, V. (2016). Massive data analysis: tasks, tools, applications, and challenges Big Data Analytics (pp. 11-40): Springer.
dc.relationQuintero-González, J.-R. (2017). Del concepto de ingeniería de tránsito al de movilidad urbana sostenible. Ambiente y Desarrollo, 21(40), 57-72.
dc.relationRen, H., Song, Y., Wang, J., Hu, Y., & Lei, J. (2018). A deep learning approach to the citywide traffic accident risk prediction. Paper presented at the 2018 21st International Conference on Intelligent Transportation Systems (ITSC).
dc.relationRijmenana, M. (2013). Purdue University Achieves Remarkable Results With Big Data. Retrieved from https://datafloq.com/read/purdue-university-achieves-remarkable-results-data/489
dc.relationRobles Aranda, Y., Trujillo Rasúa, R. A., & Sotolongo León, A. R. (2013). Algoritmos de minería de datos: Árboles de decisión y Reglas de inducción integrados a PostgreSQL.
dc.relationSemana, R. (2021). Las motos representan el 59 % del parque automotor de Colombia. Retrieved from https://www.semana.com/economia/articulo/las-motos-representan-el-59-delparque-automotor-decolombia/202157/#:~:text=El%20parque%20automotor%20de%20Colombia,336%20veh% C3%ADculos%20seg%C3%BAn%20el%20RUNT.
dc.relationShafabakhsh, G. A., Famili, A., & Bahadori, M. S. (2017). GIS-based spatial analysis of urban traffic accidents: Case study in Mashhad, Iran. Journal of traffic and transportation engineering (English edition), 4(3), 290-299.
dc.relationStrohbach M., D. J., Ravkin H., Lischka M. (2016). Big Data Storage. En:New horizons for a datadriven economy: a roadmap for usage and exploitation of big data in Europe: Springer Nature.
dc.relationTan, A. E. H. (2018). Planar and network spatial analyses of road traffic accidents-a review of methods and tools.
dc.relationLEY 769 DE 2002, (2002).
dc.relationTiempo, E. (2021). Motociclistas y peatones ponen casi el 80 % de los muertos en las vías. EL TIEMPO.
dc.relationVillavicencio, J. (2010). Introducción a series de tiempo. Puerto Rico.
dc.relationWassouf, W. N., Alkhatib, R., Salloum, K., & Balloul, S. (2020). Predictive analytics using big data for increased customer loyalty: Syriatel Telecom Company case study. Journal of Big Data, 7, 1-24.
dc.relationWen, J., Li, S., Lin, Z., Hu, Y., & Huang, C. (2012). Systematic literature review of machine learning based software development effort estimation models. Information and Software Technology, 54(1), 41-59.
dc.relationWHO. (2018). 10 Facts about road safety. Retrieved from https://www.who.int/news-room/factsin-pictures/detail/road-safety
dc.relationWHO. (2021). Road traffic injuries. Retrieved from https://www.who.int/news-room/factsheets/detail/road-traffic-injuries
dc.relationYu, L., Du, B., Hu, X., Sun, L., Han, L., & Lv, W. (2021). Deep spatio-temporal graph convolutional network for traffic accident prediction. Neurocomputing, 423, 135-147
dc.relationYuan, Z., Zhou, X., & Yang, T. (2018). Hetero-convlstm: A deep learning approach to traffic accident prediction on heterogeneous spatio-temporal data. Paper presented at the Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining.
dc.relationZhou, Z. (2019). Attention based stack resnet for citywide traffic accident prediction. Paper presented at the 2019 20th IEEE International Conference on Mobile Data Management (MDM).
dc.relationZhou, Z., Wang, Y., Xie, X., Chen, L., & Liu, H. (2020). RiskOracle: A Minute-Level Citywide Traffic Accident Forecasting Framework. Paper presented at the Proceedings of the AAAI Conference on Artificial Intelligence.
dc.relationZong, F., Chen, X., Tang, J., Yu, P., & Wu, T. (2019). Analyzing traffic crash severity with combination of information entropy and Bayesian network. IEEE Access, 7, 63288-63302.
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightshttp://purl.org/coar/access_right/c_abf2
dc.subjectAccidentes de tránsito
dc.subjectModelo predictivo
dc.subjectespacio-temporal
dc.subjectMachine learning
dc.subjectProphet
dc.subjectLSTM
dc.subjectLGB
dc.subjectTráfico urbano
dc.titleModelo predictivo de zonas de riesgo espacio temporal de accidentes de tráfico en la ciudad de Manizales
dc.typeTrabajo de grado - Maestría
dc.typehttp://purl.org/coar/resource_type/c_bdcc
dc.typeText
dc.typeinfo:eu-repo/semantics/masterThesis
dc.typehttps://purl.org/redcol/resource_type/TM
dc.typeinfo:eu-repo/semantics/publishedVersion


Este ítem pertenece a la siguiente institución