Clasificación de tráfico en Internet utilizando métodos estadísticos
Supervisor(es): Belzarena, Pablo - Bermolen, Paola
Resumen:
Este trabajo propone la identificación de tráfico de Internet en base al análisis estadístico del tamaño de los primeros segmentos intercambiados en las conexiones de transporte. La identificación de los flujos, analizando solamente el tamaño de los primeros segmentos intercambiados, tiene como principal ventaja su eventual aplicación a la clasificación “en línea” del tráfico. Esta identificación en conjunto con técnicas de calidad de servicio, enrutamiento por políticas, aplanamiento de tráfico, permitiría aportar herramientas para la gestión de una red compleja. El análisis estadístico propuesto en este trabajo se basa en la utilización de un sistema de aprendizaje supervisado conocido como Support Vector Machines(SVM). Esta técnica en los últimos años ha comenzado a aplicarse a la clasificación de tráfico y se caracteriza por su destacada capacidad de discriminación. De acuerdo a los resultados obtenidos en este trabajo, la precisión de laidentificación de tráfico utilizando la técnica SVM caracterizando los flujos por el tamaño de los primeros segmentos intercambiados, es muy buena. Al analizar el comportamiento de la precisión por tipo de aplicación aparecen diferencias importantes que se mitigaron utilizando la técnica de boosting. Esta técnica permite la generación de una secuencia de modelos SVM y se propuso la realización de una votación ponderada entre los resultados de clasificación obtenidos por cada modelo de esta secuencia. Con este procedimiento se logró incrementar la precisión de la clasificación para aquellas aplicaciones que obtenían menores niveles con la técnica de SVM, sin perjuicio de las restantes, lográndose una mejora en los resultados obtenidos en primera instancia.
2011 | |
Español | |
Universidad de la República | |
COLIBRI | |
http://hdl.handle.net/20.500.12008/2883 | |
Acceso abierto | |
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0) |
Sumario: | Este trabajo propone la identificación de tráfico de Internet en base al análisis estadístico del tamaño de los primeros segmentos intercambiados en las conexiones de transporte. La identificación de los flujos, analizando solamente el tamaño de los primeros segmentos intercambiados, tiene como principal ventaja su eventual aplicación a la clasificación “en línea” del tráfico. Esta identificación en conjunto con técnicas de calidad de servicio, enrutamiento por políticas, aplanamiento de tráfico, permitiría aportar herramientas para la gestión de una red compleja. El análisis estadístico propuesto en este trabajo se basa en la utilización de un sistema de aprendizaje supervisado conocido como Support Vector Machines(SVM). Esta técnica en los últimos años ha comenzado a aplicarse a la clasificación de tráfico y se caracteriza por su destacada capacidad de discriminación. De acuerdo a los resultados obtenidos en este trabajo, la precisión de laidentificación de tráfico utilizando la técnica SVM caracterizando los flujos por el tamaño de los primeros segmentos intercambiados, es muy buena. Al analizar el comportamiento de la precisión por tipo de aplicación aparecen diferencias importantes que se mitigaron utilizando la técnica de boosting. Esta técnica permite la generación de una secuencia de modelos SVM y se propuso la realización de una votación ponderada entre los resultados de clasificación obtenidos por cada modelo de esta secuencia. Con este procedimiento se logró incrementar la precisión de la clasificación para aquellas aplicaciones que obtenían menores niveles con la técnica de SVM, sin perjuicio de las restantes, lográndose una mejora en los resultados obtenidos en primera instancia. |
---|