Arboles de decisión y series de tiempo.

Roche, Ariel

Supervisor(es): Ghattas, Badith - Scavino, Marco

Resumen:

Dentro de los métodos enmarcados en el aprendizaje automático supervisado, muchos pueden adaptarse a los problemas que tratan con atributos en forma de series de tiempo. Se han desarrollado métodos específicos, que permiten captar mejor el factor temporal. Muchos de ellos, incluyen etapas de pre-procesamiento de los datos, que extraen nuevos atributos de las series para su posterior tratamiento mediante métodos tradicionales. Estos modelos suelen depender demasiado del problema particular y a veces también resultan difíciles de interpretar. Aquí nos propusimos desarrollar un algoritmo, específico para clasificación y regresión con atributos series de tiempo, sin tratamiento previo de los datos y de fácil interpretación. Implementamos una adaptación de CART, cambiando la forma de particionar los nodos, utilizando la medida DTWde similaridad entre series. Aplicamos el método a la base artificial CBF, ampliamente utilizada en el contexto de clusterización y clasificación de series de tiempo. También experimentamos en un problema de regresión, con datos reales de tráfico en redes de internet.


Detalles Bibliográficos
2009
SERIES TEMPORALES
ARBOLES (MATEMATICAS)
Español
Universidad de la República
COLIBRI
https://hdl.handle.net/20.500.12008/24343
Acceso abierto
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
Resumen:
Sumario:Dentro de los métodos enmarcados en el aprendizaje automático supervisado, muchos pueden adaptarse a los problemas que tratan con atributos en forma de series de tiempo. Se han desarrollado métodos específicos, que permiten captar mejor el factor temporal. Muchos de ellos, incluyen etapas de pre-procesamiento de los datos, que extraen nuevos atributos de las series para su posterior tratamiento mediante métodos tradicionales. Estos modelos suelen depender demasiado del problema particular y a veces también resultan difíciles de interpretar. Aquí nos propusimos desarrollar un algoritmo, específico para clasificación y regresión con atributos series de tiempo, sin tratamiento previo de los datos y de fácil interpretación. Implementamos una adaptación de CART, cambiando la forma de particionar los nodos, utilizando la medida DTWde similaridad entre series. Aplicamos el método a la base artificial CBF, ampliamente utilizada en el contexto de clusterización y clasificación de series de tiempo. También experimentamos en un problema de regresión, con datos reales de tráfico en redes de internet.