tesis de maestría
Combining data mining and econometric techniques : a case study on academic achievement
Fecha
2018Registro en:
10.7764/tesisUC/ING/21618
Autor
Puga Durán, Verónica Andrea
Institución
Resumen
La minería de datos está cambiando la investigación en econometría. Aunque se espera colaboración entre estas dos disciplinas, hasta donde sabemos, no hay publicaciones que intenten mostrar cómo herramientas de la minería de datos pueden complementar herramientas de la econometría. Esta investigación propone el enfoque Econometría Dialoga con la Minería de Datos, donde un modelo econométrico se construye solo desde los datos a través de la minería de datos, sin basarse en investigación bibliográfica o la opinión de expertos para seleccionar variables. El enfoque se aplicó a un caso de estudio, predecir el rendimiento académico en una base de datos longitudinal. En total, analizamos 142.457 estudiantes asociados a 1.287 variables. Empleamos un Bosque de Árboles, algoritmo de la minería de datos, para seleccionar un subconjunto de las variables para luego construir un modelo econométrico, un modelo multinivel logístico ordenado. Finalmente, utilizamos un Árbol de Decisión, algoritmo de la minería de datos, para definir perfiles de desempeño de los estudiantes. La mayoría de los hallazgos de nuestro caso de estudio son consistentes con la literatura de desempeño escolar, como la relevancia del desempeño académico pasado para el desempeño académico actual. Otros resultados ofrecen ideas más frescas, como el impacto de la evaluación de los estudiantes de su escuela en el desempeño académico de los estudiantes. Esta investigación busca contribuir al dialogo aplicado de cómo científicos de la computación y econometristas pueden colaborar para profundizar los conocimientos que las bases de datos pueden ofrecer y para mejorar los modelos econométricos.