Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall

Biardo Mirenda, Deborah - González Quintana, Guzmán - Lanzotti Filardi, Sabrina Leticia

Resumen:

Los datos manejados en las organizaciones son valiosos para la realización de múltiples investigaciones, sin embargo, poseen información personal que debe ser protegida. Por este motivo, anonimizar los datos es una tarea de vital importancia. Esto implica privatizarlos sin restarles poder informativo al momento de ser analizados. El siguiente trabajo final presenta una solución para proteger esta información personal desarrollando un modelo predictivo basado en el modelo bolsa de palabras (Bag of Words, BoW) y redes neuronales. El fin es realizar una tarea de “ciberseguridad” predictiva a partir de datos no privatizados que permita la clasificación de los identificadores de recursos uniformes (URI por sus siglas en inglés) como normales o anómalas. Se analizaron investigaciones previas referidas a esta temática utilizándose los conjuntos de datos empleados para la obtención de un conjunto de URI. A partir del conocimiento del dominio experto, se construyó una bolsa de palabras para cada “URI” que contiene la frecuencia de cada conjunto de caracteres (“keys” expertas) asociados a ataques informáticos y se añadieron caracteres adicionales al dominio experto. Se utilizó Perceptrón multicapa (MLP por sus siglas en inglés), entrenados para cada conjunto de datos por separado y luego para un único conjunto de datos. Para evaluar el modelo se emplearon técnicas como matriz de confusión, análisis y comparación de métricas “True Positive Rate” (TPR) y “True Negative Rate” (TNR) y curvas de aprendizaje. Se aplicaron técnicas como Frecuencia de término-Frecuencia inversa de documento (Tf-idf por sus siglas en inglés), utilizando los conjuntos de caracteres identificadas como “tokens”. Luego mediante la extracción de características se obtuvieron “tokens” en forma dinámica en modalidad de unigrama, bigrama y mixta. El mejor resultado obtenido fue con el modelo de TF-IDF: “Feature Extraction” Unigrama. Finalmente se aplicaron técnicas de métodos combinados como “stacking” y “majority voting”, pero no generaron mejores resultados que los del modelo TF-IDF: “Feature Extraction” Unigrama.


Detalles Bibliográficos
2020
PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
SEGURIDAD DE DATOS
REDES NEURONALES
APRENDIZAJE PROFUNDO
FIREWALLS
SEGURIDAD INFORMÁTICA
Español
Universidad ORT Uruguay
RAD
http://hdl.handle.net/20.500.11968/4500
Acceso abierto
_version_ 1807261360836313088
author Biardo Mirenda, Deborah
author2 González Quintana, Guzmán
Lanzotti Filardi, Sabrina Leticia
author2_role author
author
author_facet Biardo Mirenda, Deborah
González Quintana, Guzmán
Lanzotti Filardi, Sabrina Leticia
author_role author
bitstream.checksum.fl_str_mv 3fe7e65caa82f0cf27917f631a2057c3
29ea8fd755be7dbdc4f4bb2bdf44e62f
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
bitstream.url.fl_str_mv https://rad.ort.edu.uy/bitstreams/a4af8e9d-e575-49c4-b46f-14f4a9233c2e/download
https://rad.ort.edu.uy/bitstreams/d7df92b1-8dff-4beb-81c9-f7965f80b245/download
collection RAD
dc.contributor.advisor.none.fl_str_mv Fabián Yovine, Sergio
dc.contributor.tribunal.none.fl_str_mv Pisani Leal, Mikaela
Garbarino Alberti, Helena
dc.creator.none.fl_str_mv Biardo Mirenda, Deborah
González Quintana, Guzmán
Lanzotti Filardi, Sabrina Leticia
dc.date.accessioned.none.fl_str_mv 2021-11-30T07:58:09Z
dc.date.available.none.fl_str_mv 2021-11-30T07:58:09Z
dc.date.issued.none.fl_str_mv 2020
dc.description.abstract.none.fl_txt_mv Los datos manejados en las organizaciones son valiosos para la realización de múltiples investigaciones, sin embargo, poseen información personal que debe ser protegida. Por este motivo, anonimizar los datos es una tarea de vital importancia. Esto implica privatizarlos sin restarles poder informativo al momento de ser analizados. El siguiente trabajo final presenta una solución para proteger esta información personal desarrollando un modelo predictivo basado en el modelo bolsa de palabras (Bag of Words, BoW) y redes neuronales. El fin es realizar una tarea de “ciberseguridad” predictiva a partir de datos no privatizados que permita la clasificación de los identificadores de recursos uniformes (URI por sus siglas en inglés) como normales o anómalas. Se analizaron investigaciones previas referidas a esta temática utilizándose los conjuntos de datos empleados para la obtención de un conjunto de URI. A partir del conocimiento del dominio experto, se construyó una bolsa de palabras para cada “URI” que contiene la frecuencia de cada conjunto de caracteres (“keys” expertas) asociados a ataques informáticos y se añadieron caracteres adicionales al dominio experto. Se utilizó Perceptrón multicapa (MLP por sus siglas en inglés), entrenados para cada conjunto de datos por separado y luego para un único conjunto de datos. Para evaluar el modelo se emplearon técnicas como matriz de confusión, análisis y comparación de métricas “True Positive Rate” (TPR) y “True Negative Rate” (TNR) y curvas de aprendizaje. Se aplicaron técnicas como Frecuencia de término-Frecuencia inversa de documento (Tf-idf por sus siglas en inglés), utilizando los conjuntos de caracteres identificadas como “tokens”. Luego mediante la extracción de características se obtuvieron “tokens” en forma dinámica en modalidad de unigrama, bigrama y mixta. El mejor resultado obtenido fue con el modelo de TF-IDF: “Feature Extraction” Unigrama. Finalmente se aplicaron técnicas de métodos combinados como “stacking” y “majority voting”, pero no generaron mejores resultados que los del modelo TF-IDF: “Feature Extraction” Unigrama.
dc.description.none.fl_txt_mv Incluye bibliografía y anexos.
dc.format.extent.none.fl_str_mv 90 p. diagrs., tbls., grafs.
dc.identifier.citation.none.fl_str_mv Biardo Mirenda, D., González Quintana, G., & Lanzotti Filardi, S. L. (2020). Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.11968/4500
http://hdl.handle.net/20.500.11968/4500
dc.language.iso.none.fl_str_mv Español.
spa
dc.publisher.none.fl_str_mv Universidad ORT Uruguay
dc.relation.other.none.fl_str_mv https://sisbibliotecas.ort.edu.uy/bib/91722
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:RAD
instname:Universidad ORT Uruguay
instacron:Universidad ORT
dc.subject.none.fl_str_mv PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
SEGURIDAD DE DATOS
REDES NEURONALES
APRENDIZAJE PROFUNDO
FIREWALLS
SEGURIDAD INFORMÁTICA
dc.title.none.fl_str_mv Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall
dc.type.none.fl_str_mv Trabajo final de carrera
info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
description Incluye bibliografía y anexos.
eu_rights_str_mv openAccess
format bachelorThesis
id RAD_3fb31fe56517880d97e4172cb40398b0
identifier_str_mv Biardo Mirenda, D., González Quintana, G., & Lanzotti Filardi, S. L. (2020). Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.
instacron_str Universidad ORT
institution Universidad ORT
instname_str Universidad ORT Uruguay
language spa
language_invalid_str_mv Español.
network_acronym_str RAD
network_name_str RAD
oai_identifier_str oai:rad.ort.edu.uy:20.500.11968/4500
publishDate 2020
publisher.none.fl_str_mv Universidad ORT Uruguay
reponame_str RAD
repository.mail.fl_str_mv rodriguez_v@ort.edu.uy
repository.name.fl_str_mv RAD - Universidad ORT Uruguay
repository_id_str 3927
spelling Fabián Yovine, SergioPisani Leal, MikaelaGarbarino Alberti, HelenaBiardo Mirenda, DeborahGonzález Quintana, GuzmánLanzotti Filardi, Sabrina Leticia2021-11-30T07:58:09Z2021-11-30T07:58:09Z2020Incluye bibliografía y anexos.Los datos manejados en las organizaciones son valiosos para la realización de múltiples investigaciones, sin embargo, poseen información personal que debe ser protegida. Por este motivo, anonimizar los datos es una tarea de vital importancia. Esto implica privatizarlos sin restarles poder informativo al momento de ser analizados. El siguiente trabajo final presenta una solución para proteger esta información personal desarrollando un modelo predictivo basado en el modelo bolsa de palabras (Bag of Words, BoW) y redes neuronales. El fin es realizar una tarea de “ciberseguridad” predictiva a partir de datos no privatizados que permita la clasificación de los identificadores de recursos uniformes (URI por sus siglas en inglés) como normales o anómalas. Se analizaron investigaciones previas referidas a esta temática utilizándose los conjuntos de datos empleados para la obtención de un conjunto de URI. A partir del conocimiento del dominio experto, se construyó una bolsa de palabras para cada “URI” que contiene la frecuencia de cada conjunto de caracteres (“keys” expertas) asociados a ataques informáticos y se añadieron caracteres adicionales al dominio experto. Se utilizó Perceptrón multicapa (MLP por sus siglas en inglés), entrenados para cada conjunto de datos por separado y luego para un único conjunto de datos. Para evaluar el modelo se emplearon técnicas como matriz de confusión, análisis y comparación de métricas “True Positive Rate” (TPR) y “True Negative Rate” (TNR) y curvas de aprendizaje. Se aplicaron técnicas como Frecuencia de término-Frecuencia inversa de documento (Tf-idf por sus siglas en inglés), utilizando los conjuntos de caracteres identificadas como “tokens”. Luego mediante la extracción de características se obtuvieron “tokens” en forma dinámica en modalidad de unigrama, bigrama y mixta. El mejor resultado obtenido fue con el modelo de TF-IDF: “Feature Extraction” Unigrama. Finalmente se aplicaron técnicas de métodos combinados como “stacking” y “majority voting”, pero no generaron mejores resultados que los del modelo TF-IDF: “Feature Extraction” Unigrama.90 p. diagrs., tbls., grafs.Biardo Mirenda, D., González Quintana, G., & Lanzotti Filardi, S. L. (2020). Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.http://hdl.handle.net/20.500.11968/4500http://hdl.handle.net/20.500.11968/4500Español.spaUniversidad ORT Uruguayhttps://sisbibliotecas.ort.edu.uy/bib/91722PROYECTOS-MDBIG DATAAPRENDIZAJE AUTOMÁTICOSEGURIDAD DE DATOSREDES NEURONALESAPRENDIZAJE PROFUNDOFIREWALLSSEGURIDAD INFORMÁTICAAnálisis y desarrollo de modelos predictivos con redes neuronales para Web Application FirewallTrabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTinfo:eu-repo/semantics/openAccessFI - Master en Big Data - MDFacultad de IngenieríaMasterMaster en Big DataTrabajo finalTrabajo final (Master). Universidad ORT Uruguay, Facultad de IngenieríaTHUMBNAILMaterial completo.pdf.jpgMaterial completo.pdf.jpgGenerated Thumbnailimage/jpeg3897https://rad.ort.edu.uy/bitstreams/a4af8e9d-e575-49c4-b46f-14f4a9233c2e/download3fe7e65caa82f0cf27917f631a2057c3MD53ORIGINALMaterial completo.pdfMaterial completo.pdfdescriptionapplication/pdf1113060https://rad.ort.edu.uy/bitstreams/d7df92b1-8dff-4beb-81c9-f7965f80b245/download29ea8fd755be7dbdc4f4bb2bdf44e62fMD5120.500.11968/45002024-07-22 15:57:51.188oai:rad.ort.edu.uy:20.500.11968/4500https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-07-22T15:57:51RAD - Universidad ORT Uruguayfalse
spellingShingle Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall
Biardo Mirenda, Deborah
PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
SEGURIDAD DE DATOS
REDES NEURONALES
APRENDIZAJE PROFUNDO
FIREWALLS
SEGURIDAD INFORMÁTICA
status_str publishedVersion
title Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall
title_full Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall
title_fullStr Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall
title_full_unstemmed Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall
title_short Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall
title_sort Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall
topic PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
SEGURIDAD DE DATOS
REDES NEURONALES
APRENDIZAJE PROFUNDO
FIREWALLS
SEGURIDAD INFORMÁTICA
url http://hdl.handle.net/20.500.11968/4500