Generación automática de datos basada en modelado de aplicaciones web

Cerban Fogel, Bettina Mariel

Resumen:

El presente trabajo consiste en un proyecto de investigación y desarrollo en el marco del entrenamiento de firewalls para aplicaciones WEB. El tráfico de información entre clientes y servidores web que antes fluía solo de servidor a cliente, ahora es bidireccional. Esto permite construir aplicaciones más ricas en funcionalidades, pero también más vulnerables a actores maliciosos. La información que llega al servidor puede contener un ataque que interfiera con el funcionamiento normal de la aplicación. Con el objetivo de proteger estas aplicaciones, se están desarrollando firewalls de aplicaciones web (WAFs) basados en machine learning, capaces de aprender el comportamiento normal de la aplicación y clasificar al tráfico anormal como potenciales ataques. La construcción de estos WAFs requiere la disponibilidad de grandes juegos de datos de entrenamiento. Sin embargo, estos datos en general no están disponibles. Para generarlos, es necesario interactuar con la aplicación de forma manual e intensiva, lo cual los convierte en recursos costosos y valiosos. Como resultado de una revisión del estado del arte relacionado al problema, se propone generar un modelo de la aplicación a partir de la exploración automática de la misma, por medio de un crawler para aplicaciones web dinámicas. El modelo generado consiste en un grafo de estados y transiciones, que capturan el tráfico web. Una vez definido el modelo, es posible generar juegos de datos del tráfico de la aplicación. Para validar la efectividad de este enfoque, se construyó la herramienta Datagenio, en base a la cual se realizó un experimento orientado a establecer si cumple el objetivo del estudio. Como conclusión es posible generar el juego de datos deseado proponiéndose una serie de mejoras y desafíos pendientes en este camino de investigación.


Detalles Bibliográficos
2019
PROYECTOS-ID
APLICACIONES WEB
FIREWALLS
Español
Universidad ORT Uruguay
RAD
http://hdl.handle.net/20.500.11968/4431
Acceso abierto