proyecto
Student Retention Workflow a Data Driven And Action Based Methodology To Reduce Student Desertion
Registro en:
17IEAT-73352
2017-73352-INNOVA_PRODUCCION
Autor
Manuel Patricio Neira Cardenas
Taneq Spa
Institución
Resumen
(1) Desarrollar un Algoritmo de Preprocesamiento de Factores de Deserción con Capacidades Estadísticas que Detecte e Impute (repare) los Casos de Datos Incompletos Inconsistentes o Fuera de Rango. Este Paso es Esencial Puesto que los Datos Provistos por las Universidades Rara Vez Son Similares Tampoco se Encuentran Completamente Limpios Y/o Presentan Variaciones en los Años por Cambios en Sistemas Computacionales. Esto Permite que el Modelo Pueda Aplicarse a un Gran Número de Universidades Pues Permite Evaluar Dinámicamente Si los Datos Son Apropiados para la Aplicación de un Algoritmo Predictivo. (2) Desarrollar un Algoritmo de Predicción de la Deserción que Sea Específico por Estudiante. Las Principales Dificultades Serán: Muestras con Tamaños Desbalanceados de Clases Generación Automática de Submodelos (por Ejemplo Considerar Estudiantes por Campus o por Tipo de Carrera) Integración de Acciones Remediales y Evolución en el Tiempo. (3) Desarrollar una Metodología de Sugerencia de Acciones Remediales Apropiadas por Estudiante o Grupo de Estudiantes a Partir de la Predicción Realizada del Estudiante y sus Factores de Deserción. Para ello es Necesario Contar con una Batería de Acciones Caracterizadas por un Flujo de Trabajo Personas Tiempos y Costos Involucrados y Factores que se Ven Influidos. (4) Desarrollar un Algoritmo que Permita Evaluar el Efecto en la Deserción de Distintas Acciones Remediales Basada en Grupos de Control Diseño de Experimento y Análisis Estadístico. Este Punto es Particularmente Desafiante Puesto que Normalmente en la Teoría de Diseño de Experimentos se Tiene un Control de los Grupos de Muestra Mientras que Acá se Buscará Evaluar el Efecto de las Acciones bajo la Incertidumbre Inicial en la Predicción y el Hecho que la Aplicación de la Acción es Registrado en la Plataforma Pero Decidido por Terceras Personas. (5) Desarrollar una Plataforma Web Inteligente que Integre las Etapas de Predicción de Deserción Sugerencia de Acciones Remediales y Evaluación de Impacto de Medidas Remediales que Permita Integrar Fácilmente las Etapas de la Metodología de Manera Secuencial sin Esfuerzo para el Usuario Final y que Contenga Herramientas de Analytics para el Análisis de las Distintas Etapas. Dicha Plataforma También Debe Generar Reportes de Interés de Manera Automática para Poder Sacar el Mayor Provecho a los Datos que Han Sido Disponibilizados y a los Resultados de los Diversos Algoritmos. De Esta Manera Generar una Solución Innovadora de Alto Impacto para el Mercado de la Educación a Nivel Global lo que Generará Aumento en las Ventas de la Empresa en el Tercer Año por 10 Millones de Dólares como Resultado del Proyecto. El Objetivo General del Proyecto es Desarrollar un Sistema Compuesto por Modelos Algoritmos y Plataforma Web Además de una Clara y Definida Metodología Científica de Trabajo para la Disminución de la Deserción en las Instituciones de Educación Superior. Dicha Metodología Resulta Inherentemente Innovadora Pues No Existe Equivalente en la Literatura Ni en Software. Para ello es Necesario Diseñar e Implementar Algoritmos Específicos para las Diversas Etapas de la Metodología Validar las Interacciones y Traspaso de Datos entre las Etapas y Desarrollar una Plataforma Inteligente que Permita Encapsular y Visualizar los Resultados de los Algoritmos. Los Algoritmos se Basan en Datos de los Estudiantes y la Universidad y Tienen una Naturaleza Intrínsecamente Cuantitativa Buscando Evaluar de Manera Precisa y sin Sesgo la Probabilidad de Deserción de los Estudiantes de las Acciones a Realizar y el Efecto de Estas Acciones. La Plataforma Permitirá Facilitar el Trabajo al Contener Vistas Simplificadas para el Uso de los Distintos Actores de la Universidad: Académicos Jefes de Carrera Servicios Estudiantiles Y/o Estudiantes. Esto es Particularmente Importante Puesto que Debido a lo Sensible de la Información es Necesario que los Distintos Actores Tengan Accesos Restringidos y Específicos a la Información del Estudiante y de las Acciones que Pueden Ser Aplicadas. La Solución Propuesta se Divide en 3 Etapas Claramente Diferenciadas y que Sólo Han Sido Parcialmente Cubiertas por la Academia por lo que Requiere Gran Capacidad de Investigación Innovación y Desarrollo Tiene un Alto Grado de Dificultad en Particular Dado el Gran Volumen y Variedad de los Datos a Trabajar y de la Naturaleza Específica de Cada Uno de los Algoritmos Necesarios para el Funcionamiento Integrado de la Plataforma. El Problema a Resolver No Debe Aplicarse a una Universidad Específica Sino que Busca Desarrollar una Metodología que Pueda Aplicarse a Cualquier Universidad que lo Desee. Esto P El Proyecto Busca Desarrollar un Sistema Basado en una Metodología Científica que Permita Cuantificar y Combatir la Deserción en Instituciones de Educación Superior Utilizando el Procesamiento de Datos de Gran Volumen y Variedad y el Desarrollo de Algoritmos Avanzados de Predicción. La Metodología Permitirá Generar y Estudiar las Intervenciones para la Disminución de la Deserción Universitaria. Los Ejes Principales Son los Siguientes:(1) Detección de Alumnos en Riesgo de Deserción. Resulta Importante Porque Permite Determinar Cuáles Estudiantes Requieren una Acción que Disminuya su Riesgo de Deserción. Esta Etapa Utiliza un Gran Volumen de Datos para Poder Generar un Gran Número de Factores de Predicción y por Tanto Adaptarse a Diversas Fuentes de Información: Cada Universidad es Distinta en Términos de los Datos que Posee y de la Forma que Éstos Condicionan la Deserción. Para ello Necesita Algorítmica Avanzada (estadística) Debido al Volumen y Variedad de los Datos y del Grado de Error que Éstos Pueden Poseer. Similarmente la Clasificación de los Estudiantes a Partir de los Factores Generados Requiere de Algoritmos Sofisticados de Machine Learning para Realizar una Correcta Predicción de los Estados Futuros de los Estudiantes Antes de que Éstos Eventualmente Deserten. Una Característica Importante a Considerar es que los Algoritmos Deben Ser Interpretables: Universidad Quiere Saber por Qué los Estudiantes Desertan para Poder Aplicar las Acciones Remediales. (2) Sugerencia Automática de Acciones para Combatir la Deserción. Resulta Crucial Sugerir Cursos de Acción a la Institución Porque No Basta Saber Quién Va a Desertar y Porqué Sino que También hay que Determinar Cuál es la Acción que Permitirá Combatir las Causas de la Deserción. Esta Etapa Requiere una Amplia Revisión Bibliográfica para Generar una Batería de Acciones de las Cuales Pueda Escoger la Institución. Las Sugerencias de Acción Pueden Ser a la Institución para que Ésta Actúe o para que el Estudiante Realice de Manera Personal Ciertas Actividades. Es Necesario que Cada Acción Esté Caracterizada por un Flujo de Trabajo de Manera de Conocer el Desarrollo de la Acción las Personas Involucradas los Resultados Esperados y las Distintas Fechas Involucradas y Poder Hacer un Seguimiento de las Acciones. (3) Cuantificación del Efecto en Deserción de Acciones Realizadas. Resulta Importante Porque No Todas las Acciones Tienen la Misma Eficacia y es Necesario Saber Cuáles Acciones Están Teniendo Mayor Impacto en la Disminución de la Deserción. Requiere Desarrollar una Metodología de Evaluación Similar al A/b Testing con Grupos de Control por lo que es Necesario Aplicar Diversas Técnicas Estadística a este Problema Puntual. Para ello se Realiza un Seguimiento de las Acciones Aplicadas al Estudiante a lo Largo del Tiempo y se Evalúa en los Distintos Grupos de Control Cuáles Acciones Permitieron Reducir la Deserción. Corporación de Fomento de la Producción