Herramienta para la evaluación de calidad de datos

Clerici, Florencia - Fernández, Beatriz

Supervisor(es): Marotta, Adriana

Resumen:

Durante los últimos años los datos han tomado una gran importancia en las organizaciones. En los procesos de producción, almacenamiento y utilización de los datos se generan problemas de calidad que repercuten de forma negativa en la operativa de las organizaciones. Por lo tanto, es de suma importancia conocer y mejorar la calidad de los datos mediante, la gestión de la misma. En este proyecto se realiza un relevamiento de las herramientas existentes en el mercado y de los servicios disponibles en la web para realizar la medición de calidad de datos. En base a este análisis y la definición de requerimientos junto a la tutora se realizó el diseño, la implementación y documentación de una herramienta para la evaluación de la calidad de datos de bases de datos relacionales, la cual utiliza los conceptos de calidad de datos presentados en el curso de Calidad de Datos de FING [5]. Se logró un prototipo avanzado que puede ser utilizado por el resto de la comunidad académica. La herramienta permite y asiste en la definición de un modelo de calidad de datos para una base de datos relacional. Luego permite la ejecución del modelo para medir la calidad y la visualización de los resultados. También se deja disponible una biblioteca de especificaciones e implementaciones de métricas de calidad que pueden ser reutilizados. Las implementaciones de las métricas de calidad se realizan mediante web services externos a la herramienta, permitiendo la utilización de web services disponibles en la web. Se realizó un caso de estudio sobre una base de datos real, pudiendo realizar la evaluación de los datos y detectar donde se encuentran los mayores problemas de calidad.


Detalles Bibliográficos
2019
Base de datos relacionales
Calidad de datos
Español
Universidad de la República
COLIBRI
http://hdl.handle.net/20.500.12008/20268
Acceso abierto
Licencia Creative Commons Atribución - No Comercial - Compartir igual (CC BY-NC-SA)
Resumen:
Sumario:Durante los últimos años los datos han tomado una gran importancia en las organizaciones. En los procesos de producción, almacenamiento y utilización de los datos se generan problemas de calidad que repercuten de forma negativa en la operativa de las organizaciones. Por lo tanto, es de suma importancia conocer y mejorar la calidad de los datos mediante, la gestión de la misma. En este proyecto se realiza un relevamiento de las herramientas existentes en el mercado y de los servicios disponibles en la web para realizar la medición de calidad de datos. En base a este análisis y la definición de requerimientos junto a la tutora se realizó el diseño, la implementación y documentación de una herramienta para la evaluación de la calidad de datos de bases de datos relacionales, la cual utiliza los conceptos de calidad de datos presentados en el curso de Calidad de Datos de FING [5]. Se logró un prototipo avanzado que puede ser utilizado por el resto de la comunidad académica. La herramienta permite y asiste en la definición de un modelo de calidad de datos para una base de datos relacional. Luego permite la ejecución del modelo para medir la calidad y la visualización de los resultados. También se deja disponible una biblioteca de especificaciones e implementaciones de métricas de calidad que pueden ser reutilizados. Las implementaciones de las métricas de calidad se realizan mediante web services externos a la herramienta, permitiendo la utilización de web services disponibles en la web. Se realizó un caso de estudio sobre una base de datos real, pudiendo realizar la evaluación de los datos y detectar donde se encuentran los mayores problemas de calidad.