Design and Implementation of a Data Analysis Platform in the Educational Sector

dc.contributorJimeno, Miguel
dc.contributorWightman, Pedro
dc.contributorSalazar, Augusto
dc.creatorOsorio Salcedo, Karen Paola
dc.date2016-11-25T22:59:12Z
dc.date2016-11-25T22:59:12Z
dc.date2016-11-25
dc.date.accessioned2023-08-25T16:10:25Z
dc.date.available2023-08-25T16:10:25Z
dc.identifierhttp://hdl.handle.net/10584/5860
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/8436117
dc.descriptionIn the educational sector, tests of student´s performance are constantly being applied; these tests produce data that are not analyzed in a deep way. The goal of this project is to study and / or compare the aforementioned data through a platform for the analysis of such data using protocols to get enough bases and obtain resources for decision-making. the tools used for development are: Apache Spark Platform and Software alternates: Rapidminer, Weka, R. The solution is about an implementation of a framework called Apache Spark, for the configuration and development of a strategic environment for analyzing data. To achieve this project´s goal it was divided into two phases .The first phase, was based on the hardware and software design of a data analysis platform. The second phase was based on the design and implementation of data architecture for the platform. When designing and implementing a hardware and software infrastructure that supports a data analysis platform, the first tests were performed using virtual machines. The best environments in which the Apache Spark platform could be installed were VmWare and no virtualization. The other options did not support the large amount of information that was going to use or simply because of the computer capacity. The Apache Spark platform was compared with common applications for data mining. Apache Spark excelled in using time and resources to other applications. The analysis of any type of data allows us to obtain a global or specific sample of estimates that contribute for making a decision. Experimenting with these new technologies and comparing them to common technologies show how efficient and optimal the results of a sample of data can be to find similarities in them.
dc.descriptionEn el sector educativo, constantemente se están aplicando pruebas a estudiantes para evaluar su desempeño académico; estas pruebas brindan una gran cantidad de información, la cual no es analizada a profundidad. Este proyecto busca estudiar y/o comparar datos por medio de una plataforma para el análisis de datos del sector educativo. Entre las herramientas utilizadas para el desarrollo se encuentran: Plataforma Apache Spark y Software alternos: Rapidminer, Weka, R. La solución propuesta consiste en la implementación de un framework llamado Apache Spark, para la configuración y el desarrollo de un ambiente estratégico para analizar datos. Para cumplir con los objetivos de este proyecto, se dividió en dos fases: la primera fase, se basó en el diseño hardware y software de una plataforma de análisis de datos; la segunda fase, se basó en el diseño e implementación de una arquitectura de datos para la plataforma. A la hora de diseñar e implementar una infraestructura de hardware y software que dé soporte a una plataforma de análisis de datos, se tomaron las primeras pruebas utilizando varios métodos, con y sin virtualizaciòn. Los mejores entornos en los que se podía instalar la plataforma de Apache Spark fueron VmWare y sin virtualización. Las demás opciones no soportaban la gran cantidad de información con la que se iba a trabajar, o simplemente por los recursos del computador no eran los más eficientes. Se comparó la plataforma de Apache Spark con aplicaciones comunes para la minería de datos, donde Apache Spark superó en uso de tiempo y recursos a las demás aplicaciones. La ejecución del análisis de cualquier tipo de datos nos permite obtener una muestra global o específica de estimados que aportan a la toma de una decisión. Experimentar con estas nuevas tecnologías y compararlas a las tecnologías comunes muestran cuán eficientes y óptimos pueden ser los resultados de una muestra de datos para encontrar relaciones en los mismos.
dc.languagespa
dc.publisherBarranquilla, Universidad del Norte, 2016.
dc.rightsUniversidad del Norte
dc.rightsopenAccess
dc.subjectBigData
dc.subjectA
dc.subjectBigData
dc.subjectdata
dc.titleDiseño e Implementación de una Plataforma de Análisis de Datos en el Sector Educativo
dc.titleDesign and Implementation of a Data Analysis Platform in the Educational Sector
dc.typearticle


Este ítem pertenece a la siguiente institución