Carga de un Data Warehouse a partir de la traza de diseño

Larrañaga, Ignacio

Supervisor(es): Gutiérrez, Alejandro

Resumen:

Data Warehousing es el término generalmente usado para definir la tecnología de los sistemas de soporte a la toma de decisiones y aplicaciones OLAP. En particular se denomina Data Warehouse (DW) al repositorio de datos integrados, orientados a un dominio específico, no volátiles y variables en el tiempo, que ayudan a la toma de decisiones de una empresa u organización. La estructura de dicho DW se obtiene como resultado de un proceso de diseño generalmente guiado por alguna metodología. El proceso de extraer los datos desde donde residen y transformarlos para almacenarlos en el DW se denomina proceso de carga. El proceso de mantener estos datos actualizados se denomina actualización. La carga y actualización de un DW que fue diseñado utilizando alguna metodología es el foco de esta tesis. Este trabajo aborda el problema de la carga y actualización del DW reutilizando el conocimiento generado durante el diseño conceptual y lógico de éste. En particular, se toma como base un algoritmo existente que genera el esquema de la base de datos relacional de un DW, partiendo de un diseño conceptual del mismo, de una base de datos fuente integrada y lineamientos de diseño. Utilizando la información disponible del algoritmo este trabajo analiza los resultados que se obtendrían con un enfoque naive (basándose exclusivamente/directamente en dicho algoritmo), identifica los errores que podrían producirse con este enfoque y propone una solución que presenta un mejor desempeño y resuelve los errores encontrados.


La propuesta continúa la línea de trabajo del grupo CSI en el área de diseño lógico y conceptual de Data Warehouses, complementando las técnicas y algoritmos existentes con soluciones específicas a los problemas de carga y actualización hasta ahora no abordados en dichos trabajos.


Detalles Bibliográficos
2006
DATA WAREHOUSE
DISEÑO LOGICO DE ESQUEMAS RELACIONALES
SQL
ALGEBRA RELACIONAL
Español
Universidad de la República
COLIBRI
http://hdl.handle.net/20.500.12008/2941
Acceso abierto
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)
Resumen:
Sumario:Data Warehousing es el término generalmente usado para definir la tecnología de los sistemas de soporte a la toma de decisiones y aplicaciones OLAP. En particular se denomina Data Warehouse (DW) al repositorio de datos integrados, orientados a un dominio específico, no volátiles y variables en el tiempo, que ayudan a la toma de decisiones de una empresa u organización. La estructura de dicho DW se obtiene como resultado de un proceso de diseño generalmente guiado por alguna metodología. El proceso de extraer los datos desde donde residen y transformarlos para almacenarlos en el DW se denomina proceso de carga. El proceso de mantener estos datos actualizados se denomina actualización. La carga y actualización de un DW que fue diseñado utilizando alguna metodología es el foco de esta tesis. Este trabajo aborda el problema de la carga y actualización del DW reutilizando el conocimiento generado durante el diseño conceptual y lógico de éste. En particular, se toma como base un algoritmo existente que genera el esquema de la base de datos relacional de un DW, partiendo de un diseño conceptual del mismo, de una base de datos fuente integrada y lineamientos de diseño. Utilizando la información disponible del algoritmo este trabajo analiza los resultados que se obtendrían con un enfoque naive (basándose exclusivamente/directamente en dicho algoritmo), identifica los errores que podrían producirse con este enfoque y propone una solución que presenta un mejor desempeño y resuelve los errores encontrados.