Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"

Ampuero Velando, Pablo - Sánchez Salvagno, Julio Faustino

Resumen:

El siguiente trabajo final tiene como objetivo analizar el “framework” provisto por “OpenMined” como solución a los problemas de privacidad y acceso a múltiples conjuntos de datos que manejan los modelos de Aprendizaje Automático (“Machine Learning”) e Inteligencia Artificial, los cuales mayoritariamente son generados en forma centralizada debido a las limitaciones mencionadas. Se propone el concepto de «Descentralización de la Información» en forma segura y con las garantías para el mantenimiento tanto de la privacidad de los datos como de la calidad de los modelos. Las soluciones se basan en el uso de técnicas de “Federated Learning” (FL), “Homomorphic Encryption” (HE) y “Decentralized Learning” (DL). Se propone utilizar el “framework” provisto por “OpenMined” para generar un modelo de clasificación de detección de ataques maliciosos creando modelos para el análisis de errores y comportamiento en “logs” de “Apache Web Servers”, ya que estos contienen información sensible. Se estudia la robustez y limitaciones de los algoritmos planteados por el “framework” en cuanto a cómo anonimizar los datos y marcos de gobernanza mediante una prueba de concepto. A partir de dicha prueba se concluye que el “framework” garantiza que no se pueden identificar registros específicos a partir de las técnicas usadas de “Homomorphic Encryption”. La funcionalidad de la creación de usuarios y de un sistema de permisos sobre los datos publicados no cuenta al momento de la entrega de este trabajo con un mecanismo firme para la gobernanza de datos. En la implementación realizada el “framework” no presenta mayor complejidad al momento de ser utilizado por el “Data Science” con respecto al modelo de referencia utilizado. Tampoco se observaron impactos negativos en la calidad de los resultados. Es un “framework” en construcción por lo que se espera continuar ampliando las funcionalidades disponibles, entre ellas el entrenamiento remoto, que está en desarrollo y la función de activación de la red, en la cual se tuvo que aplicar la unidad lineal rectificada (ReLU, por sus siglas en inglés).


Detalles Bibliográficos
2021
PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
SEGURIDAD DE DATOS
SEGURIDAD INFORMÁTICA
PRIVACIDAD DIFERENCIAL
Español
Universidad ORT Uruguay
RAD
http://hdl.handle.net/20.500.11968/4502
Acceso abierto
_version_ 1807261360844701696
author Ampuero Velando, Pablo
author2 Sánchez Salvagno, Julio Faustino
author2_role author
author_facet Ampuero Velando, Pablo
Sánchez Salvagno, Julio Faustino
author_role author
bitstream.checksum.fl_str_mv b88f461464cbe96114e1d4d83dcb0652
fb02728d00d171696c082f53cdb35fc1
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
bitstream.url.fl_str_mv https://rad.ort.edu.uy/bitstreams/ec1e524c-113b-4458-8ab8-bdad2875b256/download
https://rad.ort.edu.uy/bitstreams/a876a586-4c53-4ffe-a353-62cb40c922da/download
collection RAD
dc.contributor.advisor.none.fl_str_mv Yovine, Sergio Fabián
dc.contributor.tribunal.none.fl_str_mv Garbarino Alberti, Helena
Pisani Leal, Mikaela
dc.creator.none.fl_str_mv Ampuero Velando, Pablo
Sánchez Salvagno, Julio Faustino
dc.date.accessioned.none.fl_str_mv 2021-11-03T07:31:29Z
dc.date.available.none.fl_str_mv 2021-11-03T07:31:29Z
dc.date.issued.none.fl_str_mv 2021
dc.description.abstract.none.fl_txt_mv El siguiente trabajo final tiene como objetivo analizar el “framework” provisto por “OpenMined” como solución a los problemas de privacidad y acceso a múltiples conjuntos de datos que manejan los modelos de Aprendizaje Automático (“Machine Learning”) e Inteligencia Artificial, los cuales mayoritariamente son generados en forma centralizada debido a las limitaciones mencionadas. Se propone el concepto de «Descentralización de la Información» en forma segura y con las garantías para el mantenimiento tanto de la privacidad de los datos como de la calidad de los modelos. Las soluciones se basan en el uso de técnicas de “Federated Learning” (FL), “Homomorphic Encryption” (HE) y “Decentralized Learning” (DL). Se propone utilizar el “framework” provisto por “OpenMined” para generar un modelo de clasificación de detección de ataques maliciosos creando modelos para el análisis de errores y comportamiento en “logs” de “Apache Web Servers”, ya que estos contienen información sensible. Se estudia la robustez y limitaciones de los algoritmos planteados por el “framework” en cuanto a cómo anonimizar los datos y marcos de gobernanza mediante una prueba de concepto. A partir de dicha prueba se concluye que el “framework” garantiza que no se pueden identificar registros específicos a partir de las técnicas usadas de “Homomorphic Encryption”. La funcionalidad de la creación de usuarios y de un sistema de permisos sobre los datos publicados no cuenta al momento de la entrega de este trabajo con un mecanismo firme para la gobernanza de datos. En la implementación realizada el “framework” no presenta mayor complejidad al momento de ser utilizado por el “Data Science” con respecto al modelo de referencia utilizado. Tampoco se observaron impactos negativos en la calidad de los resultados. Es un “framework” en construcción por lo que se espera continuar ampliando las funcionalidades disponibles, entre ellas el entrenamiento remoto, que está en desarrollo y la función de activación de la red, en la cual se tuvo que aplicar la unidad lineal rectificada (ReLU, por sus siglas en inglés).
dc.description.none.fl_txt_mv Incluye bibliografía y anexos.
dc.format.extent.none.fl_str_mv 61 p. diagrs., tbls., grafs.
dc.identifier.citation.none.fl_str_mv Ampuero Velando, P., & Sánchez Salvagno, J. F. (2021). Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.11968/4502
http://hdl.handle.net/20.500.11968/4502
dc.language.iso.none.fl_str_mv Español.
spa
dc.publisher.none.fl_str_mv Universidad ORT Uruguay
dc.relation.other.none.fl_str_mv https://sisbibliotecas.ort.edu.uy/bib/91830
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:RAD
instname:Universidad ORT Uruguay
instacron:Universidad ORT
dc.subject.none.fl_str_mv PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
SEGURIDAD DE DATOS
SEGURIDAD INFORMÁTICA
PRIVACIDAD DIFERENCIAL
dc.title.none.fl_str_mv Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"
dc.type.none.fl_str_mv Trabajo final de carrera
info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
description Incluye bibliografía y anexos.
eu_rights_str_mv openAccess
format bachelorThesis
id RAD_257bc8b4228a1322b6f0993f28b70437
identifier_str_mv Ampuero Velando, P., & Sánchez Salvagno, J. F. (2021). Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.
instacron_str Universidad ORT
institution Universidad ORT
instname_str Universidad ORT Uruguay
language spa
language_invalid_str_mv Español.
network_acronym_str RAD
network_name_str RAD
oai_identifier_str oai:rad.ort.edu.uy:20.500.11968/4502
publishDate 2021
publisher.none.fl_str_mv Universidad ORT Uruguay
reponame_str RAD
repository.mail.fl_str_mv rodriguez_v@ort.edu.uy
repository.name.fl_str_mv RAD - Universidad ORT Uruguay
repository_id_str 3927
spelling Yovine, Sergio FabiánGarbarino Alberti, HelenaPisani Leal, MikaelaAmpuero Velando, PabloSánchez Salvagno, Julio Faustino2021-11-03T07:31:29Z2021-11-03T07:31:29Z2021Incluye bibliografía y anexos.El siguiente trabajo final tiene como objetivo analizar el “framework” provisto por “OpenMined” como solución a los problemas de privacidad y acceso a múltiples conjuntos de datos que manejan los modelos de Aprendizaje Automático (“Machine Learning”) e Inteligencia Artificial, los cuales mayoritariamente son generados en forma centralizada debido a las limitaciones mencionadas. Se propone el concepto de «Descentralización de la Información» en forma segura y con las garantías para el mantenimiento tanto de la privacidad de los datos como de la calidad de los modelos. Las soluciones se basan en el uso de técnicas de “Federated Learning” (FL), “Homomorphic Encryption” (HE) y “Decentralized Learning” (DL). Se propone utilizar el “framework” provisto por “OpenMined” para generar un modelo de clasificación de detección de ataques maliciosos creando modelos para el análisis de errores y comportamiento en “logs” de “Apache Web Servers”, ya que estos contienen información sensible. Se estudia la robustez y limitaciones de los algoritmos planteados por el “framework” en cuanto a cómo anonimizar los datos y marcos de gobernanza mediante una prueba de concepto. A partir de dicha prueba se concluye que el “framework” garantiza que no se pueden identificar registros específicos a partir de las técnicas usadas de “Homomorphic Encryption”. La funcionalidad de la creación de usuarios y de un sistema de permisos sobre los datos publicados no cuenta al momento de la entrega de este trabajo con un mecanismo firme para la gobernanza de datos. En la implementación realizada el “framework” no presenta mayor complejidad al momento de ser utilizado por el “Data Science” con respecto al modelo de referencia utilizado. Tampoco se observaron impactos negativos en la calidad de los resultados. Es un “framework” en construcción por lo que se espera continuar ampliando las funcionalidades disponibles, entre ellas el entrenamiento remoto, que está en desarrollo y la función de activación de la red, en la cual se tuvo que aplicar la unidad lineal rectificada (ReLU, por sus siglas en inglés).61 p. diagrs., tbls., grafs.Ampuero Velando, P., & Sánchez Salvagno, J. F. (2021). Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.http://hdl.handle.net/20.500.11968/4502http://hdl.handle.net/20.500.11968/4502Español.spaUniversidad ORT Uruguayhttps://sisbibliotecas.ort.edu.uy/bib/91830PROYECTOS-MDBIG DATAAPRENDIZAJE AUTOMÁTICOSEGURIDAD DE DATOSSEGURIDAD INFORMÁTICAPRIVACIDAD DIFERENCIALPrueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"Trabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTinfo:eu-repo/semantics/openAccessFI - Master en Big Data - MDFacultad de IngenieríaMasterMaster en Big DataTrabajo finalTrabajo final (Master). Universidad ORT Uruguay, Facultad de IngenieríaTHUMBNAILMaterial completo.pdf.jpgMaterial completo.pdf.jpgGenerated Thumbnailimage/jpeg2800https://rad.ort.edu.uy/bitstreams/ec1e524c-113b-4458-8ab8-bdad2875b256/downloadb88f461464cbe96114e1d4d83dcb0652MD53ORIGINALMaterial completo.pdfMaterial completo.pdfdescriptionapplication/pdf1370942https://rad.ort.edu.uy/bitstreams/a876a586-4c53-4ffe-a353-62cb40c922da/downloadfb02728d00d171696c082f53cdb35fc1MD5120.500.11968/45022024-07-22 16:03:30.333oai:rad.ort.edu.uy:20.500.11968/4502https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-07-22T16:03:30RAD - Universidad ORT Uruguayfalse
spellingShingle Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"
Ampuero Velando, Pablo
PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
SEGURIDAD DE DATOS
SEGURIDAD INFORMÁTICA
PRIVACIDAD DIFERENCIAL
status_str publishedVersion
title Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"
title_full Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"
title_fullStr Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"
title_full_unstemmed Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"
title_short Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"
title_sort Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"
topic PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
SEGURIDAD DE DATOS
SEGURIDAD INFORMÁTICA
PRIVACIDAD DIFERENCIAL
url http://hdl.handle.net/20.500.11968/4502