Un Estudio de Text-to-SQL con Grandes

Modelo de Lenguaje

Leon Fariña, Gonzalo Rodrigo de - Ljubicic Román, Martín Pablo - Oldán Motta, Joaquín

Supervisor(es): Mayr Ojeda, Franz

Resumen:

El presente trabajo final tiene como objetivo desarrollar un asistente basado en un Large Lenguage Model (LLM) para facilitar la comprensión de sistemas a desarrolladores ciudadanos o "citizen developers" para que puedan igualmente desenvolverse en el área; testers y analistas funcionales, mediante la generación inteligente de consultas SQL a partir de lenguaje natural. El énfasis cae en el acceso a datos, implementando técnicas como Retrieval Augmented Generation (RAG), few-shot learning, chain of though sobre modelos locales para mejorar la precisión en la generación de consultas. Una complejidad del proyecto se presenta en la gestión de una base de datos con gran número de tablas y atributos de manera completamente local. El enfoque es un estudio del estado del arte, construir un sistema que traduce requerimientos a consultas SQL, y desarrollar las mismas basado en la metadata de la base de datos. Se busca generar consultas semánticamente correctas y superar desafíos de generalización sobre la estructura de diversas bases de datos. Esta tesis se encamina en busca de una contribución al campo de Text-to-SQL, abordando desafíos prácticos en la generación automática de consultas SQL, que tiene aplicaciones prometedoras en la mejora de la colaboración y eficiencia en el desarrollo de sistemas.


Detalles Bibliográficos
2024
PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
INTELIGENCIA ARTIFICIAL
MODELOS DE LENGUAJE GRANDE
SQL
REDES NEURONALES
Español
Universidad ORT Uruguay
RAD
https://hdl.handle.net/20.500.11968/7029
http://hdl.handle.net/20.500.11968/7029
Acceso abierto
Acceso abierto