Informe final del proyecto: Anonimización de datos basada en redes generativas antagónicas :: SILO. Sistema nacional de repositorios digitales. Uruguay

Reporte técnico Aceptado

Informe final del proyecto: Anonimización de datos basada en redes generativas antagónicas

Yovine, Sergio - Mayr, Franz - Visca Zanoni, Ramiro

Resumen:

El intercambio de información, ya sea en forma de datos brutos o de modelos entrenados usando aprendizaje automático, debe garantizar niveles adecuados de privacidad. Esta cuestión no es sólo técnica, sino también jurídica, ya que existen leyes que definen el derecho a la privacidad. En este proyecto estudiamos un escenario en el que varias organizaciones (públicas y/o privadas) comparten datos y modelos entrenados con datos privados de cada organización (o de sus pacientes, usuarios, clientes, etc.). El resultado del proyecto fue la propuesta de una solución que consiste en un esquema de privacidad diferencial de tipo mixto que compone un mecanismo centralizado y otro local. El primero es la disponibilización pública de un ensemble de modelos a través de un curador confiable que aplica ruido aleatorio a las predicciones, protegiendo así los datos de las organizaciones participantes en dicho ensemble de modelos. El segundo permite a un tercero realizar consultas al ensemble protegiendo su datos a través de un curador confiable que aplica un mecanismo de privacidad diferencial local que agrega ruido aleatorio a los datos enviados en la consulta. Esta técnica fue implementada y evaluada experimentalmente con éxito en aplicaciones en ciberseguridad y salud.

Detalles Bibliográficos
Fecha de publicación:	2021
Financiadores:	Agencia Nacional de Investigación e Innovación
Temas:	Anonimización de datos Aprendizaje profundo Redes generativas antagónicas Ciencias Naturales y Exactas Ciencias de la Computación e Información Ciencias de la Computación
Idioma	Español
Institución:	Agencia Nacional de Investigación e Innovación
Repositorio:	REDI
Enlace(s):	https://hdl.handle.net/20.500.12381/3141
Nivel de acceso:	Acceso abierto
Licencia:	Reconocimiento 4.0 Internacional. (CC BY)

Resultados similares

Informe final del proyecto: Herramienta de privatización de datos secuenciales para su aplicación en la detección de anomalías colectivas en ciberseguridad
Autor(es):: Yovine, Sergio
Fecha de publicación:: (2022)

Exploración del espacio latente de redes neuronales generativas antagónicas para la generación de rostros.
Autor(es):: Rey Trujillo, Gonzalo
Fecha de publicación:: (2024)

Aumentación de conjuntos de datos utilizando redes neuronales generativas profundas distribuidas : Exploración del uso de algoritmos coevolutivos multiobjetivo en busca de mejoras en la diversidad de las muestras generadas
Autor(es):: Mautone Estapé, Agustín Felipe
Fecha de publicación:: (2022)

¿Cómo compartir datos de manera efectiva y privada?
Autor(es):: Yovine, Sergio
Fecha de publicación:: (2022)

Analyzing constrained LLM through PDFA-learning
Autor(es):: Carrasco, Matías
Fecha de publicación:: (2024)

Exploration Policies for On-the-Fly Controller Synthesis: A Reinforcement Learning Approach
Autor(es):: Delgado, Tomás
Fecha de publicación:: (2023)

FLEA: Aprendizaje Federado aplicado a Analíticas de Aprendizaje
Autor(es):: Bermolen, Paola
Fecha de publicación:: (2022)

Towards Efficient Active Learning of PDFA
Autor(es):: Mayr, F.
Fecha de publicación:: (2022)

An Assessment of the Application of Private Aggregation of Ensemble Models to Sensible Data
Autor(es):: Yovine, Sergio
Fecha de publicación:: (2021)

¿Hacía dónde va el Ciesc?
Autor(es):: Rosa, Sylvia da
Fecha de publicación:: (2009)

Software basado en Pyfhel para garantizar privacidad de datos en un contexto de machine learning as a service
Autor(es):: Imbert, Walter
Fecha de publicación:: (2022)

Diseño e implementación de una plataforma para garantizar privacidad de datos en un contexto de machine learning as a service
Autor(es):: Wagner, Gonzalo
Fecha de publicación:: (2022)

Estudio de modelos de privacidad de datos
Autor(es):: Visca, Ramiro
Fecha de publicación:: (2021)

Salvando la memoria de la computación en la Universidad de la República, Uruguay, a partir de los recuerdos del profesor Manuel Sadosky
Autor(es):: Bermúdez, Laura
Fecha de publicación:: (2003)

Results of Neural-Checker Toolbox in Taysir 2023 Competition
Autor(es):: Mayr, Franz
Fecha de publicación:: (2023)

A Congruence-based Approach to Active Automata Learning from Neural Language Models
Autor(es):: Mayr, Franz
Fecha de publicación:: (2023)

Aprendiendo políticas de exploración generales para escalar la síntesis de controladores discretos
Autor(es):: Delgado, Tomás
Fecha de publicación:: (2023)

Application of PATE to Sensible Data
Autor(es):: Mayr, Franz
Fecha de publicación:: (2021)

Implementación en PySyft de "An Assessment of the Application of Private Aggregation of Ensemble Models to Sensible Data"
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2022)

Verification of webassembly programs
Autor(es):: Ocampo Herrera, Diego Ignacio
Fecha de publicación:: (2019)

Sessionizator: una herramienta para la reconstrucción de sesiones a partir de logs Apache
Autor(es):: Pisabarro, Mauricio
Fecha de publicación:: (2020)

Análisis y desarrollo de modelos predictivos con redes neuronales para Web Application Firewall
Autor(es):: Biardo, Deborah
Fecha de publicación:: (2020)

Active Learning Over Large Alphabets
Autor(es):: Vilensky, Federico
Fecha de publicación:: (2022)

Web Attack Generation
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2022)

La técnica que permite saber todo sobre los clientes sin poner en riesgo su privacidad
Autor(es):: Universidad ORT Uruguay
Fecha de publicación:: (2021)

Prototipo de “Application of Private Aggregation of Ensemble Models to Sensible Data” en la plataforma PySyft de OpenMined
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2022)

Docker deployment of DVWA vulnerable site
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2022)

DP-GEM
Autor(es):: Visca, Ramiro
Fecha de publicación:: (2021)

WebRequests
Autor(es):: Biardo, Deborah
Fecha de publicación:: (2020)

Whole genome sequencing reveals a frameshift mutation and a large deletion in YY1AP1 in a girl with a panvascular artery disease
Autor(es):: Raggio, Víctor
Fecha de publicación:: (2021)

“It will surely fall”: Exploring Teachers’ Perspectives on Commercial Robots for Preschoolers
Autor(es):: Bakala, Ewelina
Fecha de publicación:: (2023)

Normal web traffic generator
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2022)

Sesionización de Logs Apache
Autor(es):: Pisabarro, Mauricio
Fecha de publicación:: (2020)

Exploring Attention Patterns and Neural Activations in Transformer Architectures for Sequence Classification in Context Free Grammars
Autor(es):: Molinolo, Matías
Fecha de publicación:: (2024)

Property Checking with Interpretable Error Characterization for Recurrent Neural Networks
Autor(es):: Mayr, Franz
Fecha de publicación:: (2020)

Monitor de uso de la plataforma educativa CREA 2018-2021 y su puesta en producció
Autor(es):: da Silva, Natalia
Fecha de publicación:: (2024)

Análisis de la estructura factorial del desafío Bebras 2021 en Uruguay y resultados preliminares
Autor(es):: Urruticoechea, Alar
Fecha de publicación:: (2023)

Pensamiento Computacional, proceso de creación de un videojuego de medida estandarizada
Autor(es):: Goyeneche, Juan José
Fecha de publicación:: (2021)

Aprendizaje profundo para la anonimización de textos legales.
Autor(es):: Cruces, María Victoria
Fecha de publicación:: (2023)

Web logs de DVWA
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2021)