FLEA: Aprendizaje Federado aplicado a Analíticas de Aprendizaje

Bermolen, Paola - Capdheourat, Germán - Etcheverry, Lorena - Fachola, Christian - Fariello, Maria Inés - Tornaría, Agustín

Resumen:

Las técnicas de aprendizaje federado tienen como objetivo entrenar y construir modelos de aprendizaje automático basados en conjuntos de datos distribuidos a través de múltiples dispositivos evitando la fuga de datos. La idea principal es realizar el entrenamiento en dispositivos remotos o centros de datos aislados sin transferir los datos a repositorios centralizados, mitigando así los riesgos para la privacidad. La analítica de datos en la educación, en particular la analítica del aprendizaje, es un escenario prometedor para aplicar este enfoque con el fin de hacer frente a las cuestiones legales y éticas relacionadas con el tratamiento de datos sensibles. En efecto, dada la naturaleza de los datos que se van a estudiar (datos personales, resultados educativos, datos relativos a menores), es esencial asegurarse de que la realización de estos estudios y la publicación de los resultados ofrezcan las garantías necesarias para proteger la privacidad de las personas implicadas y la protección de sus datos. Además, la aplicación de técnicas cuantitativas basadas en la explotación de datos sobre el uso de plataformas educativas, rendimiento de los alumnos, uso de dispositivos, etc., puede dar cuenta de problemas educativos como la determinación de perfiles de usuarios, trayectorias de aprendizaje personalizadas, o indicadores y alertas de abandono temprano, entre otros. Este trabajo presenta los resultados del proyecto de investigación "Uso de técnicas de Aprendizaje Federado para el análisis de datos sensibles: aplicación al caso de Analíticas de Aprendizaje" financiado por la ANII (FMV_3_2020_1_162910 ), y en particular la aplicación de técnicas de aprendizaje federado a dos problemas de learning analytics: la predicción del abandono escolar y la clasificación no supervisada de estudiantes. Los experimentos permiten concluir que las soluciones propuestas alcanzan resultados comparables desde el punto de vista del rendimiento con las versiones centralizadas sin centralizar los datos para el entrenamiento de los modelos.


Detalles Bibliográficos
2022
Agencia Nacional de Investigación e Innovación
Universidad de la República
Aprendizaje Federado
Learning Analytics
Ciencias Naturales y Exactas
Ciencias de la Computación e Información
Ciencias de la Computación
Español
Agencia Nacional de Investigación e Innovación
REDI
https://hdl.handle.net/20.500.12381/3126
Acceso abierto
Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional. (CC BY-NC-SA)