article
Diseño de herramienta computacional basada en machine learning para la detección de desviaciones de consumo
Computational tool design based on machine learning for energy consumption outlier detection
Autor
Ahumada Sierra, Loui Alejandro
Institución
Resumen
Detectar de forma temprana desviaciones en los patrones de consumo es una de las actividades críticas del negocio eléctrico y en general de cualquier empresa prestadora de un servicio público. El siguiente proyecto tiene por objetivo desarrollar una herramienta computacional web a través de la cual se validen las curvas históricas de consumo de energía eléctrica de clientes no regulados del caribe colombiano a través de métodos especializados de machine learning.
Se realizó inicialmente una evaluación completa del proceso de análisis energético a través de métodos y herramientas dentro del espectro del estudio del trabajo. Del levantamiento de la información se logran poner de presente las principales falencias del proceso y se evidencia la falta de información para realizar una evaluación comparativa entre la herramienta VBA actualmente utilizada por la compañía para analizar la energía, y la nueva herramienta propuesta en este proyecto. De manera consecuente, se determina someter a crítica el resultado de cuatro técnicas de machine learning: One Class Support Vector Machines, Isolation Forest, Robust Covariance y Local Outlier Factor; para determinar el mejor modelo a partir de la construcción de la realidad en conjunto con los analistas.
A través de la crítica y análisis de resultados de la validación de los métodos se logra medir el rendimiento de cada uno de los modelos, y se determina finalmente que la mejor técnica para detectar desviaciones de consumo dentro del contexto comercial de la compañía es Robust Covariance. La técnica obtuvo la mayor valoración F1-score para modelos de machine learning, evidenciando un equilibrio fundamental entre la ocurrencia de eventos falsos positivos, falsos negativos y verdaderos positivos; así como una reducción del 93% del número de puntos de medida revisados manualmente en comparación con la herramienta VBA. Detecting early deviations in consumption patterns is one of the critical activities of the electricity business and critical as well of any company providing a public service. The following project aims to develop a web computing tool through which the historical curves of electric power consumption of unregulated customers of the Colombian Caribbean are validated through specialized methods of machine learning.
Initially, a complete evaluation of the energy analysis process was carried out through methods and tools within the spectrum of work study. From the survey of information, the main flaws of the process can be seen and the lack of information for a comparative evaluation between the VBA tool (currently used by the company to analyze energy) and the new tool proposed in this project is evident.
Consistently, it is determined to submit to criticism the result of four machine learning techniques: One Class Support Vector Machines, Isolation Forest, Robust Covariance and Local Outlier Factor; to determine the best model from the construction of reality in conjunction with analysts.
Through the criticism and analysis of the results of the validation of the methods, it is possible to measure the performance of each of the models, and finally it is determined that the best technique to detect consumption deviations within the commercial context of the company is Robust Covariance. The technique obtained the highest F1-score valuation for machine learning models, evidencing a fundamental balance between the occurrence of false positive, false negative and true positive events; as well as a 93% reduction in the number of manually reviewed customers compared to the VBA tool.