Predicciones usando mediciones correlacionadas y posiblemente incompletas

Daloia, Sebastián

Supervisor(es): Rodríguez Bocca, Pablo - Kiedanski, Diego

Resumen:

La disponibilidad de grandes volúmenes de datos y las mejoras crecientes en recursos y capacidad de cómputo de los ordenadores, permiten que la toma de decisiones basadas en tecnologías y procesos orientados a los datos sean una herramienta de uso frecuente en ámbitos de negocios, investigación y científicos. El problema de predecir el consumo de energía puede ser abordado para resolver la demanda agregada, es decir estimar el consumo total de todos los clientes. Esto es útil en situaciones de decisión como determinar si construir o no una nueva planta de generación de energía en los próximos cinco años. Otro enfoque es el de la demanda desagregada, o sea estimar el consumo de energía para cada cliente por separado. Esto permitiría conocer y caracterizar diferentes perfiles de clientes, por ejemplo para saber cuando y en que lugares es más probable que ocurran picos de consumo para determinadas situaciones climáticas o económicas. Algunas compañías o productores de electricidad, tienen como objetivo predecir el consumo de energía para cada cliente final (demanda desagregada). En este caso el problema de predecir la demanda desagregada está asociada al hecho de que cada consumidor se comporta diferente y con frecuencia de manera impredecible (debido a altas tasas de efectos aleatorios) [12, Secc.1.]. En este trabajo se presentan dos técnicas basadas en clustering, que agrupando a los clientes en perfiles de consumo similares, predicen el consumo de cada cliente a partir de la información del perfil. Ambas técnicas se comparan con las del estado del arte (Laurinec et al. [12]). Como trabajo previo al problema de predicción, se plantea un experimento teórico simplificado denominado el modelo de las monedas, en el cual se puede estudiar para que condiciones experimentales es más ventajoso emplear clustering para realizar predicciones en comparación a no emplear clustering y los efectos de factores externos al experimento o ambientales que afectan el resultado del mismo, como por ejemplo la temperatura. Se implementa, a su vez, una técnica de resumen informativo, algoritmo flashlight propuesto por El Gebaly et al.[6], que es utilizada para resumir tablas de resultados de tamaño grande y mediano, y que es empleada para analizar el problema de predicción de consumo y el modelo de las monedas.


Detalles Bibliográficos
2020
Forecasting
Demanda desagregada de consumo de energía
Clustering
Técnica de resumen automático
PROBABILIDAD
ALGORITMOS
UTILIZACION DE LA ENERGIA
PREVISION
Español
Universidad de la República
COLIBRI
https://hdl.handle.net/20.500.12008/23884
Acceso abierto
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
Resumen:
Sumario:La disponibilidad de grandes volúmenes de datos y las mejoras crecientes en recursos y capacidad de cómputo de los ordenadores, permiten que la toma de decisiones basadas en tecnologías y procesos orientados a los datos sean una herramienta de uso frecuente en ámbitos de negocios, investigación y científicos. El problema de predecir el consumo de energía puede ser abordado para resolver la demanda agregada, es decir estimar el consumo total de todos los clientes. Esto es útil en situaciones de decisión como determinar si construir o no una nueva planta de generación de energía en los próximos cinco años. Otro enfoque es el de la demanda desagregada, o sea estimar el consumo de energía para cada cliente por separado. Esto permitiría conocer y caracterizar diferentes perfiles de clientes, por ejemplo para saber cuando y en que lugares es más probable que ocurran picos de consumo para determinadas situaciones climáticas o económicas. Algunas compañías o productores de electricidad, tienen como objetivo predecir el consumo de energía para cada cliente final (demanda desagregada). En este caso el problema de predecir la demanda desagregada está asociada al hecho de que cada consumidor se comporta diferente y con frecuencia de manera impredecible (debido a altas tasas de efectos aleatorios) [12, Secc.1.]. En este trabajo se presentan dos técnicas basadas en clustering, que agrupando a los clientes en perfiles de consumo similares, predicen el consumo de cada cliente a partir de la información del perfil. Ambas técnicas se comparan con las del estado del arte (Laurinec et al. [12]). Como trabajo previo al problema de predicción, se plantea un experimento teórico simplificado denominado el modelo de las monedas, en el cual se puede estudiar para que condiciones experimentales es más ventajoso emplear clustering para realizar predicciones en comparación a no emplear clustering y los efectos de factores externos al experimento o ambientales que afectan el resultado del mismo, como por ejemplo la temperatura. Se implementa, a su vez, una técnica de resumen informativo, algoritmo flashlight propuesto por El Gebaly et al.[6], que es utilizada para resumir tablas de resultados de tamaño grande y mediano, y que es empleada para analizar el problema de predicción de consumo y el modelo de las monedas.