Trabajo de grado - Especialización
Evaluación de algoritmos de machine learning para la detección de url´s maliciosas
Fecha
2022Registro en:
Rojas-González, C. D. & Vargas-González, Y. M. (2022). Evaluación de algoritmos de machine learning para la detección de url´s maliciosas. Trabajo de Grado. Universidad Católica de Colombia. Facultad de Ingeniería. Programa de Ingeniería de Sistemas. Especialización en Seguridad de la Información. Bogotá, Colombia.
Autor
Rojas-González, Christian David
Vargas-González, Yuly Marcela
Institución
Resumen
En este trabajo se realiza la comparación entre diferentes algoritmos de machine learning, con el fin de evaluar la precisión de éstos a la hora de predecir si una URL es maliciosa o no. Para este fin, se realiza la construcción de un dataset con alrededor de 50 mil URL´s de fuentes públicas de información, clasificadas como malware, phishing, engaño, spam y benignas. Se construyen varias tuberías (pipelines) que tienen diferentes propósitos, desde la lectura de datos, hasta la evaluación de los datos en los algoritmos, todo dentro de un entorno colaborativo gratuito en la nube llamado Google Colab. Se evalúan cuatro (4) algoritmos: Decision Tree, Random Forest, Support Vector Machine y red neuronal, como también un ensamble de éstos. La decisión de utilizar estos algoritmos parte de un análisis de investigaciones ya realizadas en el mundo, en las cuales, evalúan algoritmos machine learning para la predicción de URL´s maliciosas. Una vez evaluados los resultados de predicción obtenidos, se escoge uno de los algoritmos para realizar pruebas concepto, esto es, tomar varias URL´s y probar que efectivamente el modelo esté funcionando correctamente. Finalmente, se realiza un análisis de los resultados obtenidos en todo el proceso, desde la obtención de los datos, pasando por la construcción y evaluación de los algoritmos, hasta terminar en las pruebas de concepto. (Tomado de la fuente).