info:eu-repo/semantics/article
Aprendizaje por defensa reactiva: el nuevo modelo de entrenamiento contra malware
Fecha
2021-01-14Registro en:
Rojas Villalobos, B. y Rodríguez Bravo, C. (2021). Aprendizaje por defensa reactiva: el nuevo modelo de entrenamiento contra malware. LOGOS, 2 (1): 52-67
2215-5910
Autor
Rojas Villalobos, Bernal
Rodríguez Bravo, César
Institución
Resumen
Este artículo propone un nuevo método de defensa en ciberseguridad utilizando inteligencia artificial, que puede ser aplicado en diferentes entornos, desde equipos de escritorio (personales y empresariales), hasta equipos móviles (tabletas, laptops e incluso celulares). Los sistemas antimalware o antivirus tradicionales funcionan de manera determinística (es decir, basados en reglas), mientras que los cibercriminales aparecen con técnicas cada vez más creativas para burlar estos sistemas. En este artículo se propone el diseño de una arquitectura de inteligencia artificial capaz de detectar un código malicioso mediante aprendizaje automático, con la capacidad de identificar intentos creativos de burlar los sistemas de seguridad. Esta arquitectura se basa en el entrenamiento de dos inteligencias artificiales, una maliciosa o atacante (hacker) y otra defensiva. El entrenamiento de ambos modelos se realiza mediante aprendizaje por refuerzo con Q-Learning y redes neuronales convolucionales, respectivamente. La red neuronal atacante aprenderá mediante aprendizaje por refuerzo a ejecutar los métodos más utilizados por los hackers para burlar los sistemas antivirus o antimalware, mientras que el modelo defensor hará uso de Deep Learning para convertir los archivos binarios maliciosos en imágenes, y así poder entrenarse para identificar los patrones del malware y cualquier otra variante generada por el atacante.