Resumen:: Informe final del proyecto: Anonimización de datos basada en redes generativas antagónicas :: SILO. Sistema nacional de repositorios digitales. Uruguay

Reporte técnico Aceptado

Informe final del proyecto: Anonimización de datos basada en redes generativas antagónicas

Yovine, Sergio - Mayr, Franz - Visca Zanoni, Ramiro

Resumen:

El intercambio de información, ya sea en forma de datos brutos o de modelos entrenados usando aprendizaje automático, debe garantizar niveles adecuados de privacidad. Esta cuestión no es sólo técnica, sino también jurídica, ya que existen leyes que definen el derecho a la privacidad. En este proyecto estudiamos un escenario en el que varias organizaciones (públicas y/o privadas) comparten datos y modelos entrenados con datos privados de cada organización (o de sus pacientes, usuarios, clientes, etc.). El resultado del proyecto fue la propuesta de una solución que consiste en un esquema de privacidad diferencial de tipo mixto que compone un mecanismo centralizado y otro local. El primero es la disponibilización pública de un ensemble de modelos a través de un curador confiable que aplica ruido aleatorio a las predicciones, protegiendo así los datos de las organizaciones participantes en dicho ensemble de modelos. El segundo permite a un tercero realizar consultas al ensemble protegiendo su datos a través de un curador confiable que aplica un mecanismo de privacidad diferencial local que agrega ruido aleatorio a los datos enviados en la consulta. Esta técnica fue implementada y evaluada experimentalmente con éxito en aplicaciones en ciberseguridad y salud.

Detalles Bibliográficos
Fecha de publicación:	2021
Financiadores:	Agencia Nacional de Investigación e Innovación
Temas:	Anonimización de datos Aprendizaje profundo Redes generativas antagónicas Ciencias Naturales y Exactas Ciencias de la Computación e Información Ciencias de la Computación
Idioma	Español
Institución:	Agencia Nacional de Investigación e Innovación
Repositorio:	REDI
Enlace(s):	https://hdl.handle.net/20.500.12381/3141
Nivel de acceso:	Acceso abierto
Licencia:	Reconocimiento 4.0 Internacional. (CC BY)

Resumen:
Sumario:	El intercambio de información, ya sea en forma de datos brutos o de modelos entrenados usando aprendizaje automático, debe garantizar niveles adecuados de privacidad. Esta cuestión no es sólo técnica, sino también jurídica, ya que existen leyes que definen el derecho a la privacidad. En este proyecto estudiamos un escenario en el que varias organizaciones (públicas y/o privadas) comparten datos y modelos entrenados con datos privados de cada organización (o de sus pacientes, usuarios, clientes, etc.). El resultado del proyecto fue la propuesta de una solución que consiste en un esquema de privacidad diferencial de tipo mixto que compone un mecanismo centralizado y otro local. El primero es la disponibilización pública de un ensemble de modelos a través de un curador confiable que aplica ruido aleatorio a las predicciones, protegiendo así los datos de las organizaciones participantes en dicho ensemble de modelos. El segundo permite a un tercero realizar consultas al ensemble protegiendo su datos a través de un curador confiable que aplica un mecanismo de privacidad diferencial local que agrega ruido aleatorio a los datos enviados en la consulta. Esta técnica fue implementada y evaluada experimentalmente con éxito en aplicaciones en ciberseguridad y salud.

Informe final del proyecto: Anonimización de datos basada en redes generativas antagónicas

Resultados similares