Web scraping and categorization model to compare job positions of graduates

dc.contributorPérez Gómez, Mariana
dc.contributorRueda Londoño, Claudia Elena
dc.creatorOrozco Fontalvo, María Fernanda
dc.date2023-12-05T16:23:50Z
dc.date2023-12-05T16:23:50Z
dc.date2023-11-29
dc.date.accessioned2024-04-29T14:10:08Z
dc.date.available2024-04-29T14:10:08Z
dc.identifierhttp://hdl.handle.net/10584/11821
dc.identifier.urihttps://repositorioslatinoamericanos.uchile.cl/handle/2250/9250525
dc.descriptionEl proyecto se centra en desarrollar y aplicar un modelo automatizado para analizar y comparar los cargos obtenidos por los egresados de tres universidades en Barranquilla (Universidad Del Norte, Universidad de la Costa, y Universidad Simón Bolívar) mediante web scraping en perfiles de LinkedIn. El objetivo es entender las diferencias en los cargos ocupados por los egresados, utilizando Python como herramienta principal. Se propone un modelo de clasificación de texto para categorizar los cargos y se destacan alternativas de solución, optando por Python debido a su versatilidad y gratuidad. La metodología incluye la identificación de universidades, web scraping para obtener información de perfiles, categorización de cargos, y análisis comparativo. Se presentan resultados para carreras específicas, como Ingeniería Industrial, Administración de Empresas, y Derecho, evidenciando diferencias significativas en algunas categorías de cargos. A pesar de limitaciones en la naturaleza de LinkedIn, se espera que los hallazgos impacten la toma de decisiones informada para futuros aspirantes universitarios y contribuyan a estrategias de marketing y políticas educativas. El proyecto concluye que la elección de universidad puede influir en las trayectorias laborales, y los egresados de la Universidad Del Norte, en particular, tienden a ocupar más cargos directivos, posiblemente relacionado con la calidad reconocida de la institución y la acreditación previa.
dc.descriptionThis project focuses on developing and applying an automated model to analyze and compare the positions held by graduates from three universities in Barranquilla (Universidad Del Norte, Universidad de la Costa, and Universidad Simón Bolívar) through web scraping of LinkedIn profiles. The goal is to understand the differences in the roles held by graduates, using Python as the main tool. A text classification model is proposed to categorize positions, emphasizing Python's versatility and cost-effectiveness. The methodology involves identifying universities, web scraping for profile information, position categorization, and comparative analysis. Results are presented for specific fields such as Industrial Engineering, Business Administration, and Law, revealing significant differences in certain position categories. Despite limitations in LinkedIn's nature, the findings are expected to impact informed decision-making for prospective university students and contribute to marketing strategies and educational policies. The project concludes that university choice can influence career trajectories, with graduates from Universidad Del Norte, in particular, tending to hold more managerial positions, possibly linked to the institution's recognized quality and prior accreditation.
dc.formatapplication/pdf
dc.formatimage/png
dc.languagespa
dc.publisherBarranquilla, Universidad del Norte, 2023
dc.rightsUniversidad del Norte
dc.rightsopenAccess
dc.subjectWeb scraping
dc.subjectEgresados
dc.subjectLinkedIn
dc.subjectCategorización
dc.subjectModelo automatizado
dc.titleModelo de web scraping y categorización para comparar cargos de egresados
dc.titleWeb scraping and categorization model to compare job positions of graduates
dc.typearticle


Este ítem pertenece a la siguiente institución