Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"
Resumen:
El siguiente trabajo final tiene como objetivo analizar el “framework” provisto por “OpenMined” como solución a los problemas de privacidad y acceso a múltiples conjuntos de datos que manejan los modelos de Aprendizaje Automático (“Machine Learning”) e Inteligencia Artificial, los cuales mayoritariamente son generados en forma centralizada debido a las limitaciones mencionadas. Se propone el concepto de «Descentralización de la Información» en forma segura y con las garantías para el mantenimiento tanto de la privacidad de los datos como de la calidad de los modelos. Las soluciones se basan en el uso de técnicas de “Federated Learning” (FL), “Homomorphic Encryption” (HE) y “Decentralized Learning” (DL). Se propone utilizar el “framework” provisto por “OpenMined” para generar un modelo de clasificación de detección de ataques maliciosos creando modelos para el análisis de errores y comportamiento en “logs” de “Apache Web Servers”, ya que estos contienen información sensible. Se estudia la robustez y limitaciones de los algoritmos planteados por el “framework” en cuanto a cómo anonimizar los datos y marcos de gobernanza mediante una prueba de concepto. A partir de dicha prueba se concluye que el “framework” garantiza que no se pueden identificar registros específicos a partir de las técnicas usadas de “Homomorphic Encryption”. La funcionalidad de la creación de usuarios y de un sistema de permisos sobre los datos publicados no cuenta al momento de la entrega de este trabajo con un mecanismo firme para la gobernanza de datos. En la implementación realizada el “framework” no presenta mayor complejidad al momento de ser utilizado por el “Data Science” con respecto al modelo de referencia utilizado. Tampoco se observaron impactos negativos en la calidad de los resultados. Es un “framework” en construcción por lo que se espera continuar ampliando las funcionalidades disponibles, entre ellas el entrenamiento remoto, que está en desarrollo y la función de activación de la red, en la cual se tuvo que aplicar la unidad lineal rectificada (ReLU, por sus siglas en inglés).
2021 | |
PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO SEGURIDAD DE DATOS SEGURIDAD INFORMÁTICA PRIVACIDAD DIFERENCIAL |
|
Español | |
Universidad ORT Uruguay | |
RAD | |
http://hdl.handle.net/20.500.11968/4502 | |
Acceso abierto |
_version_ | 1807261360844701696 |
---|---|
author | Ampuero Velando, Pablo |
author2 | Sánchez Salvagno, Julio Faustino |
author2_role | author |
author_facet | Ampuero Velando, Pablo Sánchez Salvagno, Julio Faustino |
author_role | author |
bitstream.checksum.fl_str_mv | b88f461464cbe96114e1d4d83dcb0652 fb02728d00d171696c082f53cdb35fc1 |
bitstream.checksumAlgorithm.fl_str_mv | MD5 MD5 |
bitstream.url.fl_str_mv | https://rad.ort.edu.uy/bitstreams/ec1e524c-113b-4458-8ab8-bdad2875b256/download https://rad.ort.edu.uy/bitstreams/a876a586-4c53-4ffe-a353-62cb40c922da/download |
collection | RAD |
dc.contributor.advisor.none.fl_str_mv | Yovine, Sergio Fabián |
dc.contributor.tribunal.none.fl_str_mv | Garbarino Alberti, Helena Pisani Leal, Mikaela |
dc.creator.none.fl_str_mv | Ampuero Velando, Pablo Sánchez Salvagno, Julio Faustino |
dc.date.accessioned.none.fl_str_mv | 2021-11-03T07:31:29Z |
dc.date.available.none.fl_str_mv | 2021-11-03T07:31:29Z |
dc.date.issued.none.fl_str_mv | 2021 |
dc.description.abstract.none.fl_txt_mv | El siguiente trabajo final tiene como objetivo analizar el “framework” provisto por “OpenMined” como solución a los problemas de privacidad y acceso a múltiples conjuntos de datos que manejan los modelos de Aprendizaje Automático (“Machine Learning”) e Inteligencia Artificial, los cuales mayoritariamente son generados en forma centralizada debido a las limitaciones mencionadas. Se propone el concepto de «Descentralización de la Información» en forma segura y con las garantías para el mantenimiento tanto de la privacidad de los datos como de la calidad de los modelos. Las soluciones se basan en el uso de técnicas de “Federated Learning” (FL), “Homomorphic Encryption” (HE) y “Decentralized Learning” (DL). Se propone utilizar el “framework” provisto por “OpenMined” para generar un modelo de clasificación de detección de ataques maliciosos creando modelos para el análisis de errores y comportamiento en “logs” de “Apache Web Servers”, ya que estos contienen información sensible. Se estudia la robustez y limitaciones de los algoritmos planteados por el “framework” en cuanto a cómo anonimizar los datos y marcos de gobernanza mediante una prueba de concepto. A partir de dicha prueba se concluye que el “framework” garantiza que no se pueden identificar registros específicos a partir de las técnicas usadas de “Homomorphic Encryption”. La funcionalidad de la creación de usuarios y de un sistema de permisos sobre los datos publicados no cuenta al momento de la entrega de este trabajo con un mecanismo firme para la gobernanza de datos. En la implementación realizada el “framework” no presenta mayor complejidad al momento de ser utilizado por el “Data Science” con respecto al modelo de referencia utilizado. Tampoco se observaron impactos negativos en la calidad de los resultados. Es un “framework” en construcción por lo que se espera continuar ampliando las funcionalidades disponibles, entre ellas el entrenamiento remoto, que está en desarrollo y la función de activación de la red, en la cual se tuvo que aplicar la unidad lineal rectificada (ReLU, por sus siglas en inglés). |
dc.description.none.fl_txt_mv | Incluye bibliografía y anexos. |
dc.format.extent.none.fl_str_mv | 61 p. diagrs., tbls., grafs. |
dc.identifier.citation.none.fl_str_mv | Ampuero Velando, P., & Sánchez Salvagno, J. F. (2021). Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería. |
dc.identifier.uri.none.fl_str_mv | http://hdl.handle.net/20.500.11968/4502 http://hdl.handle.net/20.500.11968/4502 |
dc.language.iso.none.fl_str_mv | Español. spa |
dc.publisher.none.fl_str_mv | Universidad ORT Uruguay |
dc.relation.other.none.fl_str_mv | https://sisbibliotecas.ort.edu.uy/bib/91830 |
dc.rights.none.fl_str_mv | info:eu-repo/semantics/openAccess |
dc.source.none.fl_str_mv | reponame:RAD instname:Universidad ORT Uruguay instacron:Universidad ORT |
dc.subject.none.fl_str_mv | PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO SEGURIDAD DE DATOS SEGURIDAD INFORMÁTICA PRIVACIDAD DIFERENCIAL |
dc.title.none.fl_str_mv | Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" |
dc.type.none.fl_str_mv | Trabajo final de carrera info:eu-repo/semantics/bachelorThesis |
dc.type.version.none.fl_str_mv | info:eu-repo/semantics/publishedVersion |
description | Incluye bibliografía y anexos. |
eu_rights_str_mv | openAccess |
format | bachelorThesis |
id | RAD_257bc8b4228a1322b6f0993f28b70437 |
identifier_str_mv | Ampuero Velando, P., & Sánchez Salvagno, J. F. (2021). Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería. |
instacron_str | Universidad ORT |
institution | Universidad ORT |
instname_str | Universidad ORT Uruguay |
language | spa |
language_invalid_str_mv | Español. |
network_acronym_str | RAD |
network_name_str | RAD |
oai_identifier_str | oai:rad.ort.edu.uy:20.500.11968/4502 |
publishDate | 2021 |
publisher.none.fl_str_mv | Universidad ORT Uruguay |
reponame_str | RAD |
repository.mail.fl_str_mv | rodriguez_v@ort.edu.uy |
repository.name.fl_str_mv | RAD - Universidad ORT Uruguay |
repository_id_str | 3927 |
spelling | Yovine, Sergio FabiánGarbarino Alberti, HelenaPisani Leal, MikaelaAmpuero Velando, PabloSánchez Salvagno, Julio Faustino2021-11-03T07:31:29Z2021-11-03T07:31:29Z2021Incluye bibliografía y anexos.El siguiente trabajo final tiene como objetivo analizar el “framework” provisto por “OpenMined” como solución a los problemas de privacidad y acceso a múltiples conjuntos de datos que manejan los modelos de Aprendizaje Automático (“Machine Learning”) e Inteligencia Artificial, los cuales mayoritariamente son generados en forma centralizada debido a las limitaciones mencionadas. Se propone el concepto de «Descentralización de la Información» en forma segura y con las garantías para el mantenimiento tanto de la privacidad de los datos como de la calidad de los modelos. Las soluciones se basan en el uso de técnicas de “Federated Learning” (FL), “Homomorphic Encryption” (HE) y “Decentralized Learning” (DL). Se propone utilizar el “framework” provisto por “OpenMined” para generar un modelo de clasificación de detección de ataques maliciosos creando modelos para el análisis de errores y comportamiento en “logs” de “Apache Web Servers”, ya que estos contienen información sensible. Se estudia la robustez y limitaciones de los algoritmos planteados por el “framework” en cuanto a cómo anonimizar los datos y marcos de gobernanza mediante una prueba de concepto. A partir de dicha prueba se concluye que el “framework” garantiza que no se pueden identificar registros específicos a partir de las técnicas usadas de “Homomorphic Encryption”. La funcionalidad de la creación de usuarios y de un sistema de permisos sobre los datos publicados no cuenta al momento de la entrega de este trabajo con un mecanismo firme para la gobernanza de datos. En la implementación realizada el “framework” no presenta mayor complejidad al momento de ser utilizado por el “Data Science” con respecto al modelo de referencia utilizado. Tampoco se observaron impactos negativos en la calidad de los resultados. Es un “framework” en construcción por lo que se espera continuar ampliando las funcionalidades disponibles, entre ellas el entrenamiento remoto, que está en desarrollo y la función de activación de la red, en la cual se tuvo que aplicar la unidad lineal rectificada (ReLU, por sus siglas en inglés).61 p. diagrs., tbls., grafs.Ampuero Velando, P., & Sánchez Salvagno, J. F. (2021). Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.http://hdl.handle.net/20.500.11968/4502http://hdl.handle.net/20.500.11968/4502Español.spaUniversidad ORT Uruguayhttps://sisbibliotecas.ort.edu.uy/bib/91830PROYECTOS-MDBIG DATAAPRENDIZAJE AUTOMÁTICOSEGURIDAD DE DATOSSEGURIDAD INFORMÁTICAPRIVACIDAD DIFERENCIALPrueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"Trabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTinfo:eu-repo/semantics/openAccessFI - Master en Big Data - MDFacultad de IngenieríaMasterMaster en Big DataTrabajo finalTrabajo final (Master). Universidad ORT Uruguay, Facultad de IngenieríaTHUMBNAILMaterial completo.pdf.jpgMaterial completo.pdf.jpgGenerated Thumbnailimage/jpeg2800https://rad.ort.edu.uy/bitstreams/ec1e524c-113b-4458-8ab8-bdad2875b256/downloadb88f461464cbe96114e1d4d83dcb0652MD53ORIGINALMaterial completo.pdfMaterial completo.pdfdescriptionapplication/pdf1370942https://rad.ort.edu.uy/bitstreams/a876a586-4c53-4ffe-a353-62cb40c922da/downloadfb02728d00d171696c082f53cdb35fc1MD5120.500.11968/45022024-07-22 16:03:30.333oai:rad.ort.edu.uy:20.500.11968/4502https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-07-22T16:03:30RAD - Universidad ORT Uruguayfalse |
spellingShingle | Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" Ampuero Velando, Pablo PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO SEGURIDAD DE DATOS SEGURIDAD INFORMÁTICA PRIVACIDAD DIFERENCIAL |
status_str | publishedVersion |
title | Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" |
title_full | Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" |
title_fullStr | Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" |
title_full_unstemmed | Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" |
title_short | Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" |
title_sort | Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" |
topic | PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO SEGURIDAD DE DATOS SEGURIDAD INFORMÁTICA PRIVACIDAD DIFERENCIAL |
url | http://hdl.handle.net/20.500.11968/4502 |