dc.contributor | Camargo Mendoza, Jorge Eliecer | |
dc.contributor | Fundación Universitaria Konrad Lorenz | |
dc.creator | Fandiño Benavides, Alejandro | |
dc.date.accessioned | 2022-06-09T22:34:26Z | |
dc.date.available | 2022-06-09T22:34:26Z | |
dc.date.created | 2022-06-09T22:34:26Z | |
dc.date.issued | 2022 | |
dc.identifier | https://repositorio.konradlorenz.edu.co/handle/001/4965 | |
dc.description.abstract | El objetivo y alcance del proyecto de investigación es utilizar modelos de Machine Learning para la predicción de deserción en los estudiantes de pregrado de la Fundación Universitaria Konrad Lorenz, a partir de la sabana de datos del registro académico de la universidad.
Durante la investigación, se empleó la metodología CRISP-DM que consta de seis fases: comprensión del negocio, comprensión de los datos, preparación de los datos, modelado, evaluación e implantación. En la primera fase de “compresión del negocio” se determinó la necesidad de la universidad por tener un modelo predictivo que le permita conocer la probabilidad de deserción de los estudiantes. En la segunda fase de “comprensión de los datos”, se realiza la exploración y verificación de la calidad de las tablas. En la tercera fase de “preparación de los datos”, se seleccionan las tablas a trabajar, se realiza la limpieza, se integran los datos y se dispone las tablas finales que entrarán a los modelos, estas tablas quedaron separadas por cada programa de pregrado de la universidad. En la cuarta fase de “modelado” se selecciona las técnicas de modelo y se evalúan los hiperparámetros de los modelos con la validación cruzada. En la quinta fase de “evaluación”, se evalúan los resultados de los modelos a través de las métricas mencionadas, para este caso el mejor modelo resultó ser los bosques aleatorios (Random Forest), con una exactitud superior del 95% para cada programa académico. En la sexta y última fase es la de “implantación” y se propone una arquitectura en nube que tiene como propósito integrar las fuentes y generar las salidas de los modelos para visualizarlos en un reporte. | |
dc.description.abstract | The aim and scope of the research project is to use Machine Learning models for prediction of dropout in undergraduate students of the Konrad Lorenz University Foundation, from the university’s academic record data sheet. During the investigation, the CRISP-DM methodology was used, which consists of six phases: business understanding, data understanding, data preparation, modeling, evaluation and implementation. In the first phase of "business compression" the need for the university to have a predictive model that allows it to know the probability of dropout of students was determined. In the second phase of "understanding the data", the examination and verification of the quality of the tables is performed. In the third phase of "data preparation", the tables to be worked are selected, the cleaning is carried out, the data are integrated and the final tables that will enter the models are arranged, these tables are separated by each undergraduate program of the university. In the fourth phase of "modeling" model techniques are selected and hyperparameters of models are evaluated with cross-validation. In the fifth phase of "evaluation", the results of the models are evaluated through the aforementioned metrics, for this case the best model was random forests (Random Forest), with an accuracy of more than 95% for each academic program. In the sixth and last phase is the "implementation" and a cloud architecture is proposed that aims to integrate the sources and generate the outputs of the models to visualize them in a report.
URI | |
dc.language | spa | |
dc.publisher | Bogotá D.C : Fundación Universitaria Konrad Lorenz, 2022 | |
dc.publisher | Escuela de Posgrados | |
dc.relation | Alban, M., y Mauricio, D. (2019). Neural Networks to Predict Dropout at the Universities. International Journal of Machine Learning and Computing, Vol. 9, No. 2, pp. 149-153. | |
dc.relation | Barbosa, I y Pinzón, D. (2018). Incidencia de la financiación en la deserción universitaria en Bogotá. Universidad Católica de Colombia. | |
dc.relation | Camargo, A. J. (2020). Modelo para la predicción de la deserción de estudiantes de pregrado, basado en técnicas de minería de datos (Master's thesis, Corporación Universidad de la Costa). | |
dc.relation | Edgar, T., y Manz, D. (2017). Chapter 6-machine learning. Research Methods for Cyber Security, p.153-173. | |
dc.relation | Fernández, J., y Hernández, J. (2018). Factores socioculturales que influyen en la deserción escolar de los estudiantes de la institución educativa técnica la Ceiba en Rovira-Tolima. (tesis de maestría). Universidad del Tolima. Ibagué-Tolima. | |
dc.relation | Gonzales, J., y Peñaloza, M. (2021). Identificación y predicción de estudiantes en riesgo de deserción académica por medio de modelos basados en Machine Learning. Fundación Universitaria Los Libertadores. Recuperado de: http://hdl.handle.net/11371/4188 | |
dc.relation | Moreno, J., Rodriguez, D., Sicilia, M., Riquelme, José., y Ruiz, R. (2009). SMOTE-I: mejora del algoritmo SMOTE para balanceo de clases minoritarias. Actas de los Talleres de las Jornadas de Ingeniería del Software y Bases de Datos, Vol. 3, No. 1. Recuperado de: https://www.researchgate.net/publication/229045207 | |
dc.relation | Ojeda, E., y Gonzalez, S. (2019). Análisis de la deserción estudiantil en la universidad de Cundinamarca sede Fusagasugá utilizando herramientas de inteligencia de negocios (Doctoral dissertation). | |
dc.relation | Patiño, L y Cardona, A. (2012). Revisión de algunos estudios sobre la deserción estudiantil universitaria en Colombia y Latinoamérica. Theoria, Vol.21 (1) | |
dc.relation | Richardson, A. (2011). Logistic Regression: A Self‐Learning Text, Third Edition by David G. Kleinbaum, Mitchel Klein. International Statistical Review. 79. 296-296. 10.2307/41305046. | |
dc.relation | Sokolova, M., Japkowicz, N., y Szpakowicz, S. (2006). Beyond accuracy, f-score and roc: a family of discriminant measures for performance evaluation, in: Australasian Joint Conference on Artificial Intelligence, Springer, pp. 1015–1021 | |
dc.relation | Vujović, Z. (2021). Classification Model Evaluation Metrics. International Journal of Advanced Computer Science and Applications, Vol. 12, No. 6. | |
dc.relation | Witten, I., Franck, E. y Hall, M. (2011). Data Mining Practical Machine Learning Tools and Techniques. Elsevier | |
dc.rights | Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0) | |
dc.rights | https://creativecommons.org/licenses/by-nc-nd/4.0/ | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | http://purl.org/coar/access_right/c_14cb | |
dc.rights | Atribución – No comercial – Sin derivar: permite que otros puedan descargar las obras y compartirlas con otras personas, siempre que se reconozca su autoría, pero no se pueden cambiar de ninguna manera ni se pueden utilizar comercialmente. | |
dc.title | Modelo de predicción para la deserción en la Fundación Universitaria Konrad Lorenz | |
dc.type | Trabajo de grado - Maestría | |