Tesis
Implementación en la nube de un motor estadístico para detección temprana de estudiantes en riesgo de deserción
Autor
Uayeb Caballero Rodriguez
Resumen
Esta investigación es para todos aquellos lectores que estén interesados en cómo realizar implementaciones en la nube relacionadas con las tecnologías de la información. El problema que estamos abordando es sobre cómo identificar los factores de riesgo para los estudiantes con una probabilidad de abandonar el próximo término o período académico. UNITEC, como universidad responsable de la educación profesional a nivel de maestría, tiene que identificar a todos aquellos estudiantes con perfiles en los que corren el riesgo de omitir al menos un período académico. Es importante que los jefes de carrera puedan identificar rápidamente a todos aquellos conductores que clasifique a un estudiante como un riesgo de abandono escolar y aproveche esta información para mejorar la toma de decisiones. Mi enfoque se centra en cómo la inteligencia empresarial debe utilizar temas como la ciencia de datos, la minería de datos, el análisis exploratorio de datos como parte de una solución analítica. Es por eso que este mismo documento será una guía clara sobre cómo realizar una implementación correcta de la solución de análisis avanzado. Incluirá un fuerte componente estadístico porque las nuevas tendencias de implementación inteligente utilizan mucho aprendizaje automático y, antes de realizar una implementación de esta, debemos realizar una completa gestión y limpieza de datos. Además, este documento propone cómo la ciencia de datos se relaciona rápidamente con los métodos de investigación tradicionales. Trataremos paso a paso todos los niveles sobre cómo producir nuevos conocimientos y cómo la información tecnológica juega un papel importante en el nivel de la solución de la aplicación. This research is for all those readers that are interested in how to do implementations into the cloud related to information technologies. The problem that we are addressing is about how to identify risk factors for students with a likelihood of dropout the next academic term or period. UNITEC as university responsible for educating professional at a master level has to identify all those students with profiles where they are at risk to skip at least one academic period, it is an important thing that career heads will be able to identify quickly all those drivers that classify a student as a risk of dropout and take advantage of this information to improve decision making. The focus of this one is on how business intelligence should be using topics as data science, data mining, exploratory data analysis as a part of an analytical solution. That’s why this same document will be a clear guideline in how to do a right roadmap implementation of advanced analytics solution. It will include a strong statistical component because the new trends of smart implementation use a lot of machine learning and before to do an implementation of this one, we must do a complete data wrangling and cleaning. As well this document proposed how data science is quickly related to traditional research methods. We will be addressing step by step the whole levels in how to produce new knowledge and how technology information plays an important role in the application solution level.