bachelorThesis
Análisis comparativo entre modelos de Machine Learning para la predicción de fallo en áreas axiales de un recipiente toroidal de sección recta circular para el almacenamiento de GNC
Fecha
2021Autor
Jiménez León, José Israel
Martínez Vera, Jorge Javier
Institución
Resumen
En el presente trabajo se realiza la predicción de fallo en las areas axiales en recipientes de forma toroidal de sección recta circular que almacenan Gas Natural Comprimido (GNC) a presión, utilizando el lenguaje de programación de Python en la plataforma de Google Colab, para la implementación de diferentes modelos de Machine Learning como lo son: KNN, SVM, Gradient Boosting, Random Forest, Decision Tree y Regresion Logistic, realizando el análisis y comparación de los resultados obtenidos por cada uno de ellos. En el análisis para ello se realizan training y testing de la data set para cada modelo empleado obteniendo como resultado el porcentaje de precisión de estos, mediante su variable de score, se podrá determinar cuál de estos modelos es el óptimo para la predicción de fallos en las areas axiales. Se obtienen como resultado que con KNN (Vecinos Más Cercanos) se obtuvo una precisión del 62%,con el Decision Tree se obtuvo un 64%, siendo los modelos de más bajo porcentaje de predicción, mientras que SVM y Regresion Logistic ofrecen un porcentaje muy aceptable que se encuentra entre el 73% y 80 %, además de esto Random Forest y Gradient Boosting ofrecen mejor precisión que los otros modelos en el momento de predecir el fallo en las areas axiales de un recipientes de forma toroidal de sección recta circular. In the present work, the prediction of failure is carried out in axial areas in toroidal-shaped circular section containers that store compressed natural gas (GNC) under pressure, using the Python programming language on the Google Collaborative platform, for the Implementation of different Machine Learning models such as: KNN, SVM, Gradient Boosting, Random Forest, Decision Tree and Regression Logistic, performing the analysis and comparison of the results obtained by each of them. In the analysis, for this, training and testing of the data set are carried out for each model used, obtaining as a result the percentage of precision of these, by means of its score variable, which of these models is the optimum for the prediction of failures in Axial areas. They are obtained as a result that with KNN (nearest neighbors) an accuracy of 62% was obtained, with the decision Tree, 64% was obtained, being the lowest models of prediction, while SVM and Regression Logistic offer a very high percentage Acceptable that is between 73% and 80%, in addition to this Random Forest and Gradient Boosting offer better precision than the other models at the time of predicting the failure in axial areas of a toroidal circular-sectional section.