Trabajo de grado - Pregrado
Comparación de métodos de estimación de datos faltantes en series de precipitación diaria en el Valle del Cauca.
Author
Russi Peña, Jessica
Larrahondo Méndez, Eider Alonso
Institutions
Abstract
Los datos de series climáticas se ven afectadas por la existencia de datos faltantes, por ejemplo en interrupciones ocasionales de estaciones automáticas, mal funcionamiento del instrumento de medición o reorganizaciones de la red de monitoreo. Los resultados de cualquier modelo y análisis estadístico podrían deteriorarse cuando se utilizan registros incompletos como entrada, por esto, la estimación de los datos faltantes se convierte en prioridad en el proceso de preparación de datos, que en conjunto con otras metodologías estadísticas aplicadas dejan los datos listos para su respectivo análisis. De esta forma, en este trabajo se describe y se comparan cuatro metodologías de estimación estadística, por medio de tres indicadores de desempeño (ECM - Error Cuadrático Medio, RECM - Raíz del Error Cuadrático Medio, CVRECM -Coeficiente de Variación del Error Cuadrático Medio), tres de ellas basadas en datos georreferenciados (K-Vecinos Cercanos, Distancia Inversa Ponderada, Kriging Ordinario) y una en estimaciones a partir de la información con la que se disponga de estaciones climáticas adyacentes (Regresión Lineal), para la estimación de datos faltantes en series diarias de precipitación en el Valle del Cauca, según la zona (valle o montaña) en la que se encuentre la estación climática que se va a estimar y el porcentaje de datos faltantes que se deba estimar (10,15 y 20 %). De los resultados obtenidos se destaca que el método Kriging Ordinario obtuvo el mejor desempeño en la zona de valle bajo un porcentaje de datos faltantes del 10 %, el método Regresión Lineal se desempeñó mejor en la zona de valle con un 15% de datos faltantes, el método Distancia Inversa Ponderada se desempeñó mejor en la zona de valle bajo un 20% de datos faltantes y en la zona de montaña bajo un 10% y finalmente el método K-Vecinos más cercanos se desempeñó mejor en la zona de montaña bajo un 15% y 20% de datos faltantes.