Detección de anomalías en series esparsas

Fernández, Juan Ignacio - Guillén, Facundo

Supervisor(es): Martínez Tagliafico, Sergio - Gómez, Gabriel

Resumen:

Las series temporales son una de las formas más extendidas de capturar información en la industria. Cualquiera sea el dominio, existen cantidades variables en el tiempo, cuantificables y medibles que proveen información valiosa cuando se analizan en forma correcta. La prevalencia de las series temporales en el sector productivo ha generado una creciente demanda de sistemas capaces de resolver diversos problemas que las involucran, incluyendo la detección de anomalías o valores atípicos. El objetivo principal de este proyecto fue investigar y desarrollar algoritmos para la detección de anomalías en series de tiempo esparsas, las cuales se caracterizan por presentar una proporción significativa de valores nulos durante largos períodos de tiempo. Se investigaron modelos de clustering, basados en estados, de forecasting y se desarrollaron modelos a medida basados en redes neuronales bayesianas. Algunos de los modelos desarrollados se integraron en un entorno de producción para su funcionamiento en un ambiente realista. El proyecto también involucra el desarrollo de una metodología para la generación de anomalías sintéticas de distintos tipos, necesaria para desarrollar y evaluar los modelos de detección.


Detalles Bibliográficos
2023
Series de tiempo
Anomalías
Aprendizaje automático
Demanda intermitente
Español
Universidad de la República
COLIBRI
https://hdl.handle.net/20.500.12008/40875
Acceso abierto
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
Resumen:
Sumario:Las series temporales son una de las formas más extendidas de capturar información en la industria. Cualquiera sea el dominio, existen cantidades variables en el tiempo, cuantificables y medibles que proveen información valiosa cuando se analizan en forma correcta. La prevalencia de las series temporales en el sector productivo ha generado una creciente demanda de sistemas capaces de resolver diversos problemas que las involucran, incluyendo la detección de anomalías o valores atípicos. El objetivo principal de este proyecto fue investigar y desarrollar algoritmos para la detección de anomalías en series de tiempo esparsas, las cuales se caracterizan por presentar una proporción significativa de valores nulos durante largos períodos de tiempo. Se investigaron modelos de clustering, basados en estados, de forecasting y se desarrollaron modelos a medida basados en redes neuronales bayesianas. Algunos de los modelos desarrollados se integraron en un entorno de producción para su funcionamiento en un ambiente realista. El proyecto también involucra el desarrollo de una metodología para la generación de anomalías sintéticas de distintos tipos, necesaria para desarrollar y evaluar los modelos de detección.