Prueba de concepto del framework de OpenMined para modelos de Machine Learning :: SILO. Sistema nacional de repositorios digitales. Uruguay

Tesis de maestría Aceptado

Prueba de concepto del framework de OpenMined para modelos de Machine Learning

Ampuero, Pablo - Sánchez, Julio

Supervisor(es): Yovine, Sergio

Resumen:

En la actualidad mayoritariamente los modelos de ML / AI son generados en forma centralizada debido a limitaciones sobre el acceso a los datos sensibles de diferentes fuentes por distintos motivos de protección de la privacidad. Para atacar estos dos problemas (privacidad y acceso a múltiples dataset) se propone el concepto de “Descentralización de la Información” en forma segura y con las garantías correspondientes sobre el mantenimiento tanto de la privacidad de los datos como de la calidad de los modelos. Las soluciones para esto se basan en la utilización de técnicas de Federated Learning (FL), Homomorphic Encryption (HE) y Decentralized Learning (DL). Una posible solución para abordar esta nueva forma colaborativa de trabajo es el uso del framework provisto por OpenMined para compartir data en forma anónima y poder usarla para la generación de modelos de ML sin comprometer la integridad de los resultados. Este proyecto pretende analizar y utilizar esta nueva tecnología para generar un modelo de clasificación de detección de ataques maliciosos, generando modelos para análisis de errores y comportamiento en logs de Apache Web Servers, los cuales tienen una estructura conocida pudiendo extraerse información de estos, pero que también contienen data sensible (IP, Usuario, Passwords, URI) que pueden ser usadas maliciosamente de no ser anonimizadas correctamente.

Detalles Bibliográficos
Fecha de publicación:	2021
Financiadores:	Agencia Nacional de Investigación e Innovación
Temas:	Federated Learning Differential Privacy Homomorphic Encryption Ciencias Naturales y Exactas Ciencias de la Computación e Información
Idioma	Español
Institución:	Agencia Nacional de Investigación e Innovación
Repositorio:	REDI
Enlace(s):	https://hdl.handle.net/20.500.12381/462
Nivel de acceso:	Acceso abierto
Licencia:	Reconocimiento 4.0 Internacional. (CC BY)

Resultados similares

Software basado en Pyfhel para garantizar privacidad de datos en un contexto de machine learning as a service
Autor(es):: Imbert, Walter
Fecha de publicación:: (2022)

Diseño e implementación de una plataforma para garantizar privacidad de datos en un contexto de machine learning as a service
Autor(es):: Wagner, Gonzalo
Fecha de publicación:: (2022)

Implementación de las prácticas de MLOps para PATE
Autor(es):: Ramas, Javier
Fecha de publicación:: (2022)

Prototipo de “Application of Private Aggregation of Ensemble Models to Sensible Data” en la plataforma PySyft de OpenMined
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2022)

Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"
Autor(es):: Ampuero Velando, Pablo
Fecha de publicación:: (2021)

Application of private aggregation of teacher ensembles framework for malicious web request detection
Autor(es):: Sosa, Sebastián
Fecha de publicación:: (2021)

DP-GEM
Autor(es):: Visca, Ramiro
Fecha de publicación:: (2021)

Federated learning for data analytics in education
Autor(es):: Fachola, Christian
Fecha de publicación:: (2023)

Estudio de modelos de privacidad de datos
Autor(es):: Visca, Ramiro
Fecha de publicación:: (2021)

Application of PATE to Sensible Data
Autor(es):: Mayr, Franz
Fecha de publicación:: (2021)

¿Cómo compartir datos de manera efectiva y privada?
Autor(es):: Yovine, Sergio
Fecha de publicación:: (2022)

Implementación en PySyft de "An Assessment of the Application of Private Aggregation of Ensemble Models to Sensible Data"
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2022)

A Data Protection Framework for Learning Analytics
Autor(es):: Cormack, Andrew Nicholas
Fecha de publicación:: (2016)

An Assessment of the Application of Private Aggregation of Ensemble Models to Sensible Data
Autor(es):: Yovine, Sergio
Fecha de publicación:: (2021)

FLEA: Aprendizaje Federado aplicado a Analíticas de Aprendizaje
Autor(es):: Bermolen, Paola
Fecha de publicación:: (2022)

Towards Efficient Active Learning of PDFA
Autor(es):: Mayr, F.
Fecha de publicación:: (2022)

Active Learning Over Large Alphabets
Autor(es):: Vilensky, Federico
Fecha de publicación:: (2022)

Machine learning in healthcare toward early risk prediction: A case study of liver transplantation
Autor(es):: Chatterjee, Parag
Fecha de publicación:: (2020)

A Congruence-based Approach to Active Automata Learning from Neural Language Models
Autor(es):: Mayr, Franz
Fecha de publicación:: (2023)

Mining arguments in scientific abstracts: Application to argumentative quality assessment
Autor(es):: Accuosto, Pablo
Fecha de publicación:: (2021)

Framework para la generación automática de logs para el entrenamiento de modelos de aprendizaje automático
Autor(es):: Pisani, Mikaela
Fecha de publicación:: (2021)

Learning Math through peer interaction and intelligent machines
Autor(es):: De León, Dinorah
Fecha de publicación:: (2022)

Learning for Optimization with Virtual Savant
Autor(es):: Massobrio, Renzo
Fecha de publicación:: (2021)

Exploration Policies for On-the-Fly Controller Synthesis: A Reinforcement Learning Approach
Autor(es):: Delgado, Tomás
Fecha de publicación:: (2023)

FLEA: Aprendizaje Federado aplicado a Analíticas de Aprendizaje
Autor(es):: Bermolen, Paola
Fecha de publicación:: (2022)

Analyzing constrained LLM through PDFA-learning
Autor(es):: Carrasco, Matías
Fecha de publicación:: (2024)

Legal, Risk and Ethical Aspects of Analytics in Higher Education
Autor(es):: Kay, David
Fecha de publicación:: (2012)

Lawfare: o uso estratégico do direito em face do ativismo judicial e da judicialização da política
Autor(es):: Bezerra Parmera, André
Fecha de publicación:: (2023)

Predicting wireless RSSI using machine learning on graphs.
Autor(es):: Rattaro, Claudina
Fecha de publicación:: (2021)

When Teachers and Machines Achieve the Best Combination: A National Comparative Study of Face-to-face and Blended Teaching and Learning
Autor(es):: Marconi, Cecilia
Fecha de publicación:: (2017)

The Impact of Staff Interaction in the Learning Experience of Visitors to a Science Centre: An Initial Framework for Facilitation
Autor(es):: Machado Corral, Soledad
Fecha de publicación:: (2020)

Machine learning applied to the operation of fully renewable energy systems
Autor(es):: Chaer, Ruben
Fecha de publicación:: (2023)

Machine learning-assisted virtual patching of web applications
Autor(es):: Betarte, Gustavo
Fecha de publicación:: (2018)

Web application attacks detection using machine learning techniques
Autor(es):: Betarte, Gustavo
Fecha de publicación:: (2018)

Enhancing web application attack detection using machine learning
Autor(es):: Martínez, Rodrigo
Fecha de publicación:: (2018)

Results of Neural-Checker Toolbox in Taysir 2023 Competition
Autor(es):: Mayr, Franz
Fecha de publicación:: (2023)

Mexico: Aprende en Casa (Learning at home)
Autor(es):: Ripani, María Florencia
Fecha de publicación:: (2020)

Big Data for All: Privacy and User Control in the Age of Analytics
Autor(es):: Tene, Omer
Fecha de publicación:: (2013)

No-reference video quality measurement : added value of machine learning
Autor(es):: Mocanu, Decebal Constantin
Fecha de publicación:: (2015)

Machine Learning methods for genome enabled prediction of complex traits : Benchmarking and robustness to marker elimination
Autor(es):: Elenter, Juan
Fecha de publicación:: (2021)