Análisis del comportamiento de los usuarios en una red educativa a partir de consultas DNS.
Supervisor(es): Grampín, Eduardo - Castro, Alberto
Resumen:
Este trabajo de tesis se basa en el estudio y análisis del comportamiento de los usuarios dentro de una red con servicio de Internet, teniendo como única fuente de información las consultas Domain Name System (DNS). Hasta el momento de realización de esta tesis, estos datos eran almacenados sin poder aprovechar su valor. Por este motivo, es de gran importancia explorar y analizar estos datos, que pertenecen a una red que está distribuida en todo el país y que cuenta con la peculiaridad de que es utilizada, principalmente, por estudiantes de primaria y secundaria. Estas consultas DNS fueron recopiladas y aportadas para este trabajo por el principal Proveedor de Servicios Educativos (ESP, siglas en inglés) en Uruguay, Plan Ceibal. Plan Ceibal es un ESP que apoya un programa de computación uno a uno y ha implementado una infraestructura de Tecnología de la Información y las Comunicaciones (TIC) en todas las escuelas primarias y secundarias públicas de Uruguay. Esto ha permitido tener una red desplegada a lo largo y ancho del país con conectividad Wi-Fi, a disposición de todos los estudiantes de los distintos centros educativos, para poder acceder a distintos recursos educativos a través de una conexión estándar a Internet. En total, se recolectaron aproximadamente más de 32 mil millones de registros DNS durante todo el año lectivo 2019, período de tiempo con el cual se trabajó. Para poder trabajar con esta dimensionalidad de datos, se tuvo que utilizar una plataforma que permita soportar el trabajo con volúmenes de datos a escala Big Data. A lo largo de este estudio se emplearon distintas técnicas de machine learning no supervisadas (lineales y no-lineales) para poder obtener información sobre el comportamiento de los usuarios en la red. A partir de esto, fue posible visualizar algunos resultados considerables, como por ejemplo, que el comportamiento de uso de Internet por parte de los estudiantes está muy influenciado por el grupo de edad y hora del día, sin embargo, no depende de la ubicación geográfica de los usuarios. Quedaron en evidencia las diferencias y semejanzas en cuanto al tipo de contenido consumido por parte de los usuarios. Por ejemplo, el uso de redes sociales con el de dominios de contenido educativo, o la similitud entre el uso de los servicios de streaming y el de las redes sociales. Finalmente, a partir de datos obtenidos mediante una herramienta para analizar los paquetes de red desplegada en algunos centros educativos, y los registros DNS pertenecientes a esos mismos locales, se crea un modelo básico y lineal para la predicción de tráfico/consumo de ciertas aplicaciones (YouTube, Facebook, Google, etc.) en la red. El valor de los resultados obtenidos se puede ver, por un lado, desde la perspectiva del operador de red, ya que se puede observar qué tipos de contenidos son consumidos por los usuarios y en qué horario. Esto permite tomar decisiones mejor fundamentadas para mejorar la calidad del servicio. Por otro lado, desde la perspectiva educativa, los resultados permiten saber qué tipo de contenido educativo es consumido y por cuáles usuarios, destacando a qué público se llega a través de los programas educativos analizados. A partir de esta investigación Plan Ceibal trabajó un nuevo enfoque desde la importancia de la recolección y análisis de los datos que provienen de las consultas DNS. A su vez, les permitió impulsar su propia plataforma Big Data y nuevas investigaciones.
2022 | |
REDES DE COMPUTADORAS ANÁLISIS DE DATOS RECURSOS EDUCATIVOS TECNOLOGÍA EDUCATIVA |
|
Español | |
Universidad de la República | |
COLIBRI | |
https://hdl.handle.net/20.500.12008/40898 | |
Acceso abierto | |
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0) |