Tesis
Modelo de predicción de la calidad del aire a partir de datos meteorológicos e información del tráfico automovilístico
Fecha
2018Registro en:
Ramírez Suárez, J. M. (2018). Modelo de predicción de la calidad del aire a partir de datos meteorológicos e información del tráfico automovilístico (Tesis de pregrado). Universidad de las Américas, Quito.
UDLA-EC-TIS-2018-02
Autor
Ramírez Suárez, Jessie María
Institución
Resumen
La contaminación del aire representa un importante riesgo medioambiental para la salud. Únicamente buscando disminuir los niveles de esta contaminación, los países pueden reducir la carga de morbilidad derivada de accidentes cerebrovasculares, cánceres de pulmón y neumopatías crónicas y agudas, entre ellas el asma. (Organización Mundial de la Salud, 2016). En el artículo Modeling PM2.5 Urban Pollution Using Machine Learning and Selected Meteorological Parameters publicado el 18 de Junio de 2017 por Yves Rybarczyk, Mario Gonzalez y Rasa Zalakeiciute, docentes de la Universidad de las Américas; proponen un enfoque de aprendizaje automático basado en seis años de análisis de datos meteorológicos y de contaminación con el fin de predecir las concentraciones de material particulado fino (PM2.5) a partir de los niveles de viento (velocidad y dirección) y precipitación aplicando el algoritmo de Regresión Lineal. En el presente documento de tesis, se definen conceptos de Machine Learning como: Aprendizaje Supervisado, Clasificadores, Regresión, entre otros temas. Para obtener la información, se ejecutaron dos aplicaciones en la recolección de datos, los cuales se obtuvieron por los métodos que a continuación se detallan: datos del tiempo de tráfico administrado por Google Maps. Pantallas capturadas de Google Maps, obteniendo información del tráfico representado en colores rojo, naranja y verde, graficados en forma rectangular. Y, por último, se recolectaron datos realizando un corte de área circular. Toda la información obtenida en estos tres métodos se almacenó en un archivo CSV, el mismo que se refresca cada 10 minutos. Ya obtenidos los archivos CSV, se realizó el preprocesamiento de datos procediendo a una limpieza de la información llenando los espacios vacíos de los archivos CSV con el signo ? para cargarlos en el software Weka, se trabajó con Regresión Lineal, los clasificadores como Redes Neuronales, SVM, Regresión Logística y KNN. Con los resultados obtenidos se elaboraron matrices de confusión para la construcción de la curva ROC a fin de obtener la técnica de aprendizaje supervisado con mejor desempeño. A futuro se podrá desarrollar una aplicación, con el objetivo de que este ente conozca el nivel de contaminación al que la población se expone y tomar medidas correctivas.