Generación automática de datos basada en modelado de aplicaciones web

Cerban Fogel, Bettina Mariel

Resumen:

El presente trabajo consiste en un proyecto de investigación y desarrollo en el marco del entrenamiento de firewalls para aplicaciones WEB. El tráfico de información entre clientes y servidores web que antes fluía solo de servidor a cliente, ahora es bidireccional. Esto permite construir aplicaciones más ricas en funcionalidades, pero también más vulnerables a actores maliciosos. La información que llega al servidor puede contener un ataque que interfiera con el funcionamiento normal de la aplicación. Con el objetivo de proteger estas aplicaciones, se están desarrollando firewalls de aplicaciones web (WAFs) basados en machine learning, capaces de aprender el comportamiento normal de la aplicación y clasificar al tráfico anormal como potenciales ataques. La construcción de estos WAFs requiere la disponibilidad de grandes juegos de datos de entrenamiento. Sin embargo, estos datos en general no están disponibles. Para generarlos, es necesario interactuar con la aplicación de forma manual e intensiva, lo cual los convierte en recursos costosos y valiosos. Como resultado de una revisión del estado del arte relacionado al problema, se propone generar un modelo de la aplicación a partir de la exploración automática de la misma, por medio de un crawler para aplicaciones web dinámicas. El modelo generado consiste en un grafo de estados y transiciones, que capturan el tráfico web. Una vez definido el modelo, es posible generar juegos de datos del tráfico de la aplicación. Para validar la efectividad de este enfoque, se construyó la herramienta Datagenio, en base a la cual se realizó un experimento orientado a establecer si cumple el objetivo del estudio. Como conclusión es posible generar el juego de datos deseado proponiéndose una serie de mejoras y desafíos pendientes en este camino de investigación.


Detalles Bibliográficos
2019
PROYECTOS-ID
APLICACIONES WEB
FIREWALLS
Español
Universidad ORT Uruguay
RAD
http://hdl.handle.net/20.500.11968/4431
Acceso abierto
_version_ 1807261358819901440
author Cerban Fogel, Bettina Mariel
author_facet Cerban Fogel, Bettina Mariel
author_role author
bitstream.checksum.fl_str_mv 36b508f1a3bb3107e0081cee1fd65873
1c6b8d8a960c71ace1177bf4684f68cd
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
bitstream.url.fl_str_mv https://rad.ort.edu.uy/bitstreams/0e1945c4-4e68-484d-9839-ef5a6e1f1060/download
https://rad.ort.edu.uy/bitstreams/29548e0a-0069-4838-aa01-827b3c809f5c/download
collection RAD
dc.contributor.advisor.none.fl_str_mv Fornaro Rosado, Carlos Nicolás
dc.contributor.tribunal.none.fl_str_mv Braberman, Victor Adrian
Salvetto De León, Pedro Fernando
dc.creator.none.fl_str_mv Cerban Fogel, Bettina Mariel
dc.date.issued.none.fl_str_mv 2019
dc.description.abstract.none.fl_txt_mv El presente trabajo consiste en un proyecto de investigación y desarrollo en el marco del entrenamiento de firewalls para aplicaciones WEB. El tráfico de información entre clientes y servidores web que antes fluía solo de servidor a cliente, ahora es bidireccional. Esto permite construir aplicaciones más ricas en funcionalidades, pero también más vulnerables a actores maliciosos. La información que llega al servidor puede contener un ataque que interfiera con el funcionamiento normal de la aplicación. Con el objetivo de proteger estas aplicaciones, se están desarrollando firewalls de aplicaciones web (WAFs) basados en machine learning, capaces de aprender el comportamiento normal de la aplicación y clasificar al tráfico anormal como potenciales ataques. La construcción de estos WAFs requiere la disponibilidad de grandes juegos de datos de entrenamiento. Sin embargo, estos datos en general no están disponibles. Para generarlos, es necesario interactuar con la aplicación de forma manual e intensiva, lo cual los convierte en recursos costosos y valiosos. Como resultado de una revisión del estado del arte relacionado al problema, se propone generar un modelo de la aplicación a partir de la exploración automática de la misma, por medio de un crawler para aplicaciones web dinámicas. El modelo generado consiste en un grafo de estados y transiciones, que capturan el tráfico web. Una vez definido el modelo, es posible generar juegos de datos del tráfico de la aplicación. Para validar la efectividad de este enfoque, se construyó la herramienta Datagenio, en base a la cual se realizó un experimento orientado a establecer si cumple el objetivo del estudio. Como conclusión es posible generar el juego de datos deseado proponiéndose una serie de mejoras y desafíos pendientes en este camino de investigación.
dc.description.none.fl_txt_mv Incluye materiales complementarios.
Incluye bibliografía y anexos
dc.format.extent.none.fl_str_mv 112 p. diagrs., tbls., grafs.
dc.identifier.citation.none.fl_str_mv Cerban Fogel, B. M. (2019). Generación automática de datos basada en modelado de aplicaciones web (Proyecto). Universidad ORT Uruguay, Facultad de Ingeniería.
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.11968/4431
dc.language.iso.none.fl_str_mv Español.
spa
dc.publisher.none.fl_str_mv Universidad ORT Uruguay
dc.relation.other.none.fl_str_mv https://sisbibliotecas.ort.edu.uy/bib/90542
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:RAD
instname:Universidad ORT Uruguay
instacron:Universidad ORT
dc.subject.none.fl_str_mv PROYECTOS-ID
APLICACIONES WEB
FIREWALLS
dc.title.none.fl_str_mv Generación automática de datos basada en modelado de aplicaciones web
dc.type.none.fl_str_mv Trabajo final de carrera
info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
description Incluye materiales complementarios.
eu_rights_str_mv openAccess
format bachelorThesis
id RAD_b5966eb98a9e36d7e7af6a5354c79973
identifier_str_mv Cerban Fogel, B. M. (2019). Generación automática de datos basada en modelado de aplicaciones web (Proyecto). Universidad ORT Uruguay, Facultad de Ingeniería.
instacron_str Universidad ORT
institution Universidad ORT
instname_str Universidad ORT Uruguay
language spa
language_invalid_str_mv Español.
network_acronym_str RAD
network_name_str RAD
oai_identifier_str oai:rad.ort.edu.uy:20.500.11968/4431
publishDate 2019
publisher.none.fl_str_mv Universidad ORT Uruguay
reponame_str RAD
repository.mail.fl_str_mv rodriguez_v@ort.edu.uy
repository.name.fl_str_mv RAD - Universidad ORT Uruguay
repository_id_str 3927
spelling Fornaro Rosado, Carlos NicolásBraberman, Victor AdrianSalvetto De León, Pedro FernandoCerban Fogel, Bettina Mariel2019Incluye materiales complementarios.Incluye bibliografía y anexosEl presente trabajo consiste en un proyecto de investigación y desarrollo en el marco del entrenamiento de firewalls para aplicaciones WEB. El tráfico de información entre clientes y servidores web que antes fluía solo de servidor a cliente, ahora es bidireccional. Esto permite construir aplicaciones más ricas en funcionalidades, pero también más vulnerables a actores maliciosos. La información que llega al servidor puede contener un ataque que interfiera con el funcionamiento normal de la aplicación. Con el objetivo de proteger estas aplicaciones, se están desarrollando firewalls de aplicaciones web (WAFs) basados en machine learning, capaces de aprender el comportamiento normal de la aplicación y clasificar al tráfico anormal como potenciales ataques. La construcción de estos WAFs requiere la disponibilidad de grandes juegos de datos de entrenamiento. Sin embargo, estos datos en general no están disponibles. Para generarlos, es necesario interactuar con la aplicación de forma manual e intensiva, lo cual los convierte en recursos costosos y valiosos. Como resultado de una revisión del estado del arte relacionado al problema, se propone generar un modelo de la aplicación a partir de la exploración automática de la misma, por medio de un crawler para aplicaciones web dinámicas. El modelo generado consiste en un grafo de estados y transiciones, que capturan el tráfico web. Una vez definido el modelo, es posible generar juegos de datos del tráfico de la aplicación. Para validar la efectividad de este enfoque, se construyó la herramienta Datagenio, en base a la cual se realizó un experimento orientado a establecer si cumple el objetivo del estudio. Como conclusión es posible generar el juego de datos deseado proponiéndose una serie de mejoras y desafíos pendientes en este camino de investigación.112 p. diagrs., tbls., grafs.Cerban Fogel, B. M. (2019). Generación automática de datos basada en modelado de aplicaciones web (Proyecto). Universidad ORT Uruguay, Facultad de Ingeniería.http://hdl.handle.net/20.500.11968/4431Español.spaUniversidad ORT Uruguayhttps://sisbibliotecas.ort.edu.uy/bib/90542PROYECTOS-IDAPLICACIONES WEBFIREWALLSGeneración automática de datos basada en modelado de aplicaciones webTrabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTinfo:eu-repo/semantics/openAccessFI - Ingeniería en Sistemas - IDFacultad de IngenieríaCarrera UniversitariaIngeniera en SistemasProyectoProyecto (Carrera Universitaria). Universidad ORT Uruguay, Facultad de IngenieríaTHUMBNAILMaterial completo.pdf.jpgMaterial completo.pdf.jpgGenerated Thumbnailimage/jpeg3372https://rad.ort.edu.uy/bitstreams/0e1945c4-4e68-484d-9839-ef5a6e1f1060/download36b508f1a3bb3107e0081cee1fd65873MD53ORIGINALMaterial completo.pdfMaterial completo.pdfdescriptionapplication/pdf11794357https://rad.ort.edu.uy/bitstreams/29548e0a-0069-4838-aa01-827b3c809f5c/download1c6b8d8a960c71ace1177bf4684f68cdMD5120.500.11968/44312024-07-22 16:07:33.017oai:rad.ort.edu.uy:20.500.11968/4431https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-07-22T16:07:33RAD - Universidad ORT Uruguayfalse
spellingShingle Generación automática de datos basada en modelado de aplicaciones web
Cerban Fogel, Bettina Mariel
PROYECTOS-ID
APLICACIONES WEB
FIREWALLS
status_str publishedVersion
title Generación automática de datos basada en modelado de aplicaciones web
title_full Generación automática de datos basada en modelado de aplicaciones web
title_fullStr Generación automática de datos basada en modelado de aplicaciones web
title_full_unstemmed Generación automática de datos basada en modelado de aplicaciones web
title_short Generación automática de datos basada en modelado de aplicaciones web
title_sort Generación automática de datos basada en modelado de aplicaciones web
topic PROYECTOS-ID
APLICACIONES WEB
FIREWALLS
url http://hdl.handle.net/20.500.11968/4431