Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall
Resumen:
Los datos manejados en las organizaciones son valiosos para la realización de múltiples investigaciones, sin embargo, poseen información personal que debe ser protegida. Por este motivo, anonimizar los datos es una tarea de vital importancia. Esto implica privatizarlos sin restarles poder informativo al momento de ser analizados. El siguiente trabajo final presenta una solución para proteger esta información personal desarrollando un modelo predictivo basado en el modelo bolsa de palabras (Bag of Words, BoW) y redes neuronales. El fin es realizar una tarea de “ciberseguridad” predictiva a partir de datos no privatizados que permita la clasificación de los identificadores de recursos uniformes (URI por sus siglas en inglés) como normales o anómalas. Se analizaron investigaciones previas referidas a esta temática utilizándose los conjuntos de datos empleados para la obtención de un conjunto de URI. A partir del conocimiento del dominio experto, se construyó una bolsa de palabras para cada “URI” que contiene la frecuencia de cada conjunto de caracteres (“keys” expertas) asociados a ataques informáticos y se añadieron caracteres adicionales al dominio experto. Se utilizó Perceptrón multicapa (MLP por sus siglas en inglés), entrenados para cada conjunto de datos por separado y luego para un único conjunto de datos. Para evaluar el modelo se emplearon técnicas como matriz de confusión, análisis y comparación de métricas “True Positive Rate” (TPR) y “True Negative Rate” (TNR) y curvas de aprendizaje. Se aplicaron técnicas como Frecuencia de término-Frecuencia inversa de documento (Tf-idf por sus siglas en inglés), utilizando los conjuntos de caracteres identificadas como “tokens”. Luego mediante la extracción de características se obtuvieron “tokens” en forma dinámica en modalidad de unigrama, bigrama y mixta. El mejor resultado obtenido fue con el modelo de TF-IDF: “Feature Extraction” Unigrama. Finalmente se aplicaron técnicas de métodos combinados como “stacking” y “majority voting”, pero no generaron mejores resultados que los del modelo TF-IDF: “Feature Extraction” Unigrama.
2020 | |
PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO SEGURIDAD DE DATOS REDES NEURONALES APRENDIZAJE PROFUNDO FIREWALLS SEGURIDAD INFORMÁTICA |
|
Español | |
Universidad ORT Uruguay | |
RAD | |
http://hdl.handle.net/20.500.11968/4500 | |
Acceso abierto |
_version_ | 1807261360836313088 |
---|---|
author | Biardo Mirenda, Deborah |
author2 | González Quintana, Guzmán Lanzotti Filardi, Sabrina Leticia |
author2_role | author author |
author_facet | Biardo Mirenda, Deborah González Quintana, Guzmán Lanzotti Filardi, Sabrina Leticia |
author_role | author |
bitstream.checksum.fl_str_mv | 3fe7e65caa82f0cf27917f631a2057c3 29ea8fd755be7dbdc4f4bb2bdf44e62f |
bitstream.checksumAlgorithm.fl_str_mv | MD5 MD5 |
bitstream.url.fl_str_mv | https://rad.ort.edu.uy/bitstreams/a4af8e9d-e575-49c4-b46f-14f4a9233c2e/download https://rad.ort.edu.uy/bitstreams/d7df92b1-8dff-4beb-81c9-f7965f80b245/download |
collection | RAD |
dc.contributor.advisor.none.fl_str_mv | Fabián Yovine, Sergio |
dc.contributor.tribunal.none.fl_str_mv | Pisani Leal, Mikaela Garbarino Alberti, Helena |
dc.creator.none.fl_str_mv | Biardo Mirenda, Deborah González Quintana, Guzmán Lanzotti Filardi, Sabrina Leticia |
dc.date.accessioned.none.fl_str_mv | 2021-11-30T07:58:09Z |
dc.date.available.none.fl_str_mv | 2021-11-30T07:58:09Z |
dc.date.issued.none.fl_str_mv | 2020 |
dc.description.abstract.none.fl_txt_mv | Los datos manejados en las organizaciones son valiosos para la realización de múltiples investigaciones, sin embargo, poseen información personal que debe ser protegida. Por este motivo, anonimizar los datos es una tarea de vital importancia. Esto implica privatizarlos sin restarles poder informativo al momento de ser analizados. El siguiente trabajo final presenta una solución para proteger esta información personal desarrollando un modelo predictivo basado en el modelo bolsa de palabras (Bag of Words, BoW) y redes neuronales. El fin es realizar una tarea de “ciberseguridad” predictiva a partir de datos no privatizados que permita la clasificación de los identificadores de recursos uniformes (URI por sus siglas en inglés) como normales o anómalas. Se analizaron investigaciones previas referidas a esta temática utilizándose los conjuntos de datos empleados para la obtención de un conjunto de URI. A partir del conocimiento del dominio experto, se construyó una bolsa de palabras para cada “URI” que contiene la frecuencia de cada conjunto de caracteres (“keys” expertas) asociados a ataques informáticos y se añadieron caracteres adicionales al dominio experto. Se utilizó Perceptrón multicapa (MLP por sus siglas en inglés), entrenados para cada conjunto de datos por separado y luego para un único conjunto de datos. Para evaluar el modelo se emplearon técnicas como matriz de confusión, análisis y comparación de métricas “True Positive Rate” (TPR) y “True Negative Rate” (TNR) y curvas de aprendizaje. Se aplicaron técnicas como Frecuencia de término-Frecuencia inversa de documento (Tf-idf por sus siglas en inglés), utilizando los conjuntos de caracteres identificadas como “tokens”. Luego mediante la extracción de características se obtuvieron “tokens” en forma dinámica en modalidad de unigrama, bigrama y mixta. El mejor resultado obtenido fue con el modelo de TF-IDF: “Feature Extraction” Unigrama. Finalmente se aplicaron técnicas de métodos combinados como “stacking” y “majority voting”, pero no generaron mejores resultados que los del modelo TF-IDF: “Feature Extraction” Unigrama. |
dc.description.none.fl_txt_mv | Incluye bibliografía y anexos. |
dc.format.extent.none.fl_str_mv | 90 p. diagrs., tbls., grafs. |
dc.identifier.citation.none.fl_str_mv | Biardo Mirenda, D., González Quintana, G., & Lanzotti Filardi, S. L. (2020). Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería. |
dc.identifier.uri.none.fl_str_mv | http://hdl.handle.net/20.500.11968/4500 http://hdl.handle.net/20.500.11968/4500 |
dc.language.iso.none.fl_str_mv | Español. spa |
dc.publisher.none.fl_str_mv | Universidad ORT Uruguay |
dc.relation.other.none.fl_str_mv | https://sisbibliotecas.ort.edu.uy/bib/91722 |
dc.rights.none.fl_str_mv | info:eu-repo/semantics/openAccess |
dc.source.none.fl_str_mv | reponame:RAD instname:Universidad ORT Uruguay instacron:Universidad ORT |
dc.subject.none.fl_str_mv | PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO SEGURIDAD DE DATOS REDES NEURONALES APRENDIZAJE PROFUNDO FIREWALLS SEGURIDAD INFORMÁTICA |
dc.title.none.fl_str_mv | Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall |
dc.type.none.fl_str_mv | Trabajo final de carrera info:eu-repo/semantics/bachelorThesis |
dc.type.version.none.fl_str_mv | info:eu-repo/semantics/publishedVersion |
description | Incluye bibliografía y anexos. |
eu_rights_str_mv | openAccess |
format | bachelorThesis |
id | RAD_3fb31fe56517880d97e4172cb40398b0 |
identifier_str_mv | Biardo Mirenda, D., González Quintana, G., & Lanzotti Filardi, S. L. (2020). Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería. |
instacron_str | Universidad ORT |
institution | Universidad ORT |
instname_str | Universidad ORT Uruguay |
language | spa |
language_invalid_str_mv | Español. |
network_acronym_str | RAD |
network_name_str | RAD |
oai_identifier_str | oai:rad.ort.edu.uy:20.500.11968/4500 |
publishDate | 2020 |
publisher.none.fl_str_mv | Universidad ORT Uruguay |
reponame_str | RAD |
repository.mail.fl_str_mv | rodriguez_v@ort.edu.uy |
repository.name.fl_str_mv | RAD - Universidad ORT Uruguay |
repository_id_str | 3927 |
spelling | Fabián Yovine, SergioPisani Leal, MikaelaGarbarino Alberti, HelenaBiardo Mirenda, DeborahGonzález Quintana, GuzmánLanzotti Filardi, Sabrina Leticia2021-11-30T07:58:09Z2021-11-30T07:58:09Z2020Incluye bibliografía y anexos.Los datos manejados en las organizaciones son valiosos para la realización de múltiples investigaciones, sin embargo, poseen información personal que debe ser protegida. Por este motivo, anonimizar los datos es una tarea de vital importancia. Esto implica privatizarlos sin restarles poder informativo al momento de ser analizados. El siguiente trabajo final presenta una solución para proteger esta información personal desarrollando un modelo predictivo basado en el modelo bolsa de palabras (Bag of Words, BoW) y redes neuronales. El fin es realizar una tarea de “ciberseguridad” predictiva a partir de datos no privatizados que permita la clasificación de los identificadores de recursos uniformes (URI por sus siglas en inglés) como normales o anómalas. Se analizaron investigaciones previas referidas a esta temática utilizándose los conjuntos de datos empleados para la obtención de un conjunto de URI. A partir del conocimiento del dominio experto, se construyó una bolsa de palabras para cada “URI” que contiene la frecuencia de cada conjunto de caracteres (“keys” expertas) asociados a ataques informáticos y se añadieron caracteres adicionales al dominio experto. Se utilizó Perceptrón multicapa (MLP por sus siglas en inglés), entrenados para cada conjunto de datos por separado y luego para un único conjunto de datos. Para evaluar el modelo se emplearon técnicas como matriz de confusión, análisis y comparación de métricas “True Positive Rate” (TPR) y “True Negative Rate” (TNR) y curvas de aprendizaje. Se aplicaron técnicas como Frecuencia de término-Frecuencia inversa de documento (Tf-idf por sus siglas en inglés), utilizando los conjuntos de caracteres identificadas como “tokens”. Luego mediante la extracción de características se obtuvieron “tokens” en forma dinámica en modalidad de unigrama, bigrama y mixta. El mejor resultado obtenido fue con el modelo de TF-IDF: “Feature Extraction” Unigrama. Finalmente se aplicaron técnicas de métodos combinados como “stacking” y “majority voting”, pero no generaron mejores resultados que los del modelo TF-IDF: “Feature Extraction” Unigrama.90 p. diagrs., tbls., grafs.Biardo Mirenda, D., González Quintana, G., & Lanzotti Filardi, S. L. (2020). Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.http://hdl.handle.net/20.500.11968/4500http://hdl.handle.net/20.500.11968/4500Español.spaUniversidad ORT Uruguayhttps://sisbibliotecas.ort.edu.uy/bib/91722PROYECTOS-MDBIG DATAAPRENDIZAJE AUTOMÁTICOSEGURIDAD DE DATOSREDES NEURONALESAPRENDIZAJE PROFUNDOFIREWALLSSEGURIDAD INFORMÁTICAAnálisis y desarrollo de modelos predictivos con redes neuronales para Web Application FirewallTrabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTinfo:eu-repo/semantics/openAccessFI - Master en Big Data - MDFacultad de IngenieríaMasterMaster en Big DataTrabajo finalTrabajo final (Master). Universidad ORT Uruguay, Facultad de IngenieríaTHUMBNAILMaterial completo.pdf.jpgMaterial completo.pdf.jpgGenerated Thumbnailimage/jpeg3897https://rad.ort.edu.uy/bitstreams/a4af8e9d-e575-49c4-b46f-14f4a9233c2e/download3fe7e65caa82f0cf27917f631a2057c3MD53ORIGINALMaterial completo.pdfMaterial completo.pdfdescriptionapplication/pdf1113060https://rad.ort.edu.uy/bitstreams/d7df92b1-8dff-4beb-81c9-f7965f80b245/download29ea8fd755be7dbdc4f4bb2bdf44e62fMD5120.500.11968/45002024-07-22 15:57:51.188oai:rad.ort.edu.uy:20.500.11968/4500https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-07-22T15:57:51RAD - Universidad ORT Uruguayfalse |
spellingShingle | Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall Biardo Mirenda, Deborah PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO SEGURIDAD DE DATOS REDES NEURONALES APRENDIZAJE PROFUNDO FIREWALLS SEGURIDAD INFORMÁTICA |
status_str | publishedVersion |
title | Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall |
title_full | Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall |
title_fullStr | Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall |
title_full_unstemmed | Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall |
title_short | Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall |
title_sort | Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall |
topic | PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO SEGURIDAD DE DATOS REDES NEURONALES APRENDIZAJE PROFUNDO FIREWALLS SEGURIDAD INFORMÁTICA |
url | http://hdl.handle.net/20.500.11968/4500 |