info:eu-repo/semantics/bachelorThesis
Modelo predictivo que analice cuales son las zonas con mayor índice de peligrosidad en la ciudad de Guayaquil y a partir de esta información predecir qué sectores en desarrollo tendrán el mismo nivel de delincuencia.
Autor
Flores Asinc, Miguel Alfonso
Resumen
En el presente proyecto de investigación contiene el diseño de un
modelo predictivo que analice las zonas con mayor índice de peligrosidad en
la ciudad de Guayaquil y con esta información predecir qué sectores en
desarrollo tendrán un aumento de delincuencia usando la minería de datos y
algoritmos de aprendizaje de máquina. Este modelado se lo hará con el uso
de herramientas de programación con las que se podrá limpiar los datos,
procesarlos y aplicando aprendizaje supervisado junto con algoritmos de
regresión y random forest y así de esta manera entrenar el modelo y poder
predecir valores futuros de la delincuencia en las diferentes zonas de
Guayaquil y poder ser visualizados en una herramienta de visualización de
datos. Todo el proceso desde la recopilación de datos hasta el análisis de los
resultados obtenidos forma parte de las etapas de la metodología de minería
de datos KDD o Knowlede Discovery in Databases. Los objetivos del proyecto
de investigación constan de recopilar y analizar variables que describan a un
sector como peligroso, diseño propio del modelo predictivo y la valoración de
las predicciones obtenidas tras la creación del modelo. Por último, el proyecto
concluye con la visualización de los algoritmos de regresión en una
herramienta de visualización que presente las zonas que puedan convertirse
en peligrosas en un futuro. This research project contains the design of a predictive model that
analyzes the areas with the highest index of danger in the city of Guayaquil
and with this information predict which developing sectors will have an
increase in crime using data mining and machine learning algorithms. This
modeling will be done with the use of programming tools that will be used to
clean the data, process it and apply supervised learning algorithms like linear
regression and ramdom forest to train the model and predict future values of
crime in different areas of Guayaquil and be able to be visualized in a data
visualization software. The whole process from data collection to the analysis
of the results obtained is part of the stages of the KDD or Knowlede Discovery
in Databases (KDD) data mining methodology. The objectives of the research
project consist of collecting and analyzing variables that describe a sector as
dangerous, the design of the predictive model itself and the assessment of the
predictions obtained after the creation of the model. Finally, the project
concludes with the visualization of the regression algorithms in a visualization
software that presents the areas that may become dangerous in the future.