Predicción de tráfico en la red del Plan Ceibal

Pastorini, Marcos

Supervisor(es): Castro, Alberto

Resumen:

En Uruguay, Plan Ceibal tiene desplegados mas de 10.000 puntos de acceso WiFi en centros educativos y organizaciones sociales, esto implica una de las infraestructuras de red mas grandes del país, con dimensiones comparables a las que tienen los operadores de redes celulares comerciales. Como todo operador de red, Plan Ceibal necesita conocer las características del tráfico de la red, incluida la clasificación y los volúmenes asociados por aplicación. La clasificación de tráfico tradicional es un proceso costoso, que implica herramientas de software específicas y hardware distribuido para la recopilación y el análisis de datos centralizados. En esto proyecto se propuso evitar el despliegue masivo de una solución de monitoreo y clasificación de tráfico, buscando inferir esos datos a partir de alguna otra fuente también disponible de la propia red. En tal sentido, dado que actualmente los centros que forman parte de la red del Plan Ceibal utilizan un servicio de DNS en la nube (Cisco Umbrella), el objetivo de este proyecto fue diseñar y desarrollar algoritmos de predicción de tráfico para las distintas aplicaciones a partir de los datos de las consultas DNS aplicando técnicas de aprendizaje automático profundo. La metodología implementada en este proyecto extiende la capacidad de análisis de tráfico del Plan Ceibal, permitiéndole abordar diferentes casos de uso como planificación de la red a mediano y largo plazo, o para predecir eventos de multitudes repentinas (flash crowd), que exigen una reconfiguración rápida de la red para satisfacer la demanda y evitar colapsos. Durante el desarrollo del proyecto se genero conocimiento sobre el manejo de grandes volúmenes de datos, y se procesaron y perfeccionaron los conjuntos de datos generados por las herramientas del Plan Ceibal. También se investigo el funcionamiento del machine learning automatizado (AutoML) para generar modelos de redes neuronales capaces de predecir la cantidad de consultas DNS y transformarlas en volumen de tráfico, expandiendo la capacidad de las herramientas preexistentes sin agregar costos de infraestructura.


Detalles Bibliográficos
2022
Español
Universidad de la República
COLIBRI
https://hdl.handle.net/20.500.12008/33960
Acceso abierto
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
Resumen:
Sumario:En Uruguay, Plan Ceibal tiene desplegados mas de 10.000 puntos de acceso WiFi en centros educativos y organizaciones sociales, esto implica una de las infraestructuras de red mas grandes del país, con dimensiones comparables a las que tienen los operadores de redes celulares comerciales. Como todo operador de red, Plan Ceibal necesita conocer las características del tráfico de la red, incluida la clasificación y los volúmenes asociados por aplicación. La clasificación de tráfico tradicional es un proceso costoso, que implica herramientas de software específicas y hardware distribuido para la recopilación y el análisis de datos centralizados. En esto proyecto se propuso evitar el despliegue masivo de una solución de monitoreo y clasificación de tráfico, buscando inferir esos datos a partir de alguna otra fuente también disponible de la propia red. En tal sentido, dado que actualmente los centros que forman parte de la red del Plan Ceibal utilizan un servicio de DNS en la nube (Cisco Umbrella), el objetivo de este proyecto fue diseñar y desarrollar algoritmos de predicción de tráfico para las distintas aplicaciones a partir de los datos de las consultas DNS aplicando técnicas de aprendizaje automático profundo. La metodología implementada en este proyecto extiende la capacidad de análisis de tráfico del Plan Ceibal, permitiéndole abordar diferentes casos de uso como planificación de la red a mediano y largo plazo, o para predecir eventos de multitudes repentinas (flash crowd), que exigen una reconfiguración rápida de la red para satisfacer la demanda y evitar colapsos. Durante el desarrollo del proyecto se genero conocimiento sobre el manejo de grandes volúmenes de datos, y se procesaron y perfeccionaron los conjuntos de datos generados por las herramientas del Plan Ceibal. También se investigo el funcionamiento del machine learning automatizado (AutoML) para generar modelos de redes neuronales capaces de predecir la cantidad de consultas DNS y transformarlas en volumen de tráfico, expandiendo la capacidad de las herramientas preexistentes sin agregar costos de infraestructura.