Un Estudio de Text-to-SQL con Grandes

Modelo de Lenguaje

Leon Fariña, Gonzalo Rodrigo de - Ljubicic Román, Martín Pablo - Oldán Motta, Joaquín

Supervisor(es): Mayr Ojeda, Franz

Resumen:

El presente trabajo final tiene como objetivo desarrollar un asistente basado en un Large Lenguage Model (LLM) para facilitar la comprensión de sistemas a desarrolladores ciudadanos o "citizen developers" para que puedan igualmente desenvolverse en el área; testers y analistas funcionales, mediante la generación inteligente de consultas SQL a partir de lenguaje natural. El énfasis cae en el acceso a datos, implementando técnicas como Retrieval Augmented Generation (RAG), few-shot learning, chain of though sobre modelos locales para mejorar la precisión en la generación de consultas. Una complejidad del proyecto se presenta en la gestión de una base de datos con gran número de tablas y atributos de manera completamente local. El enfoque es un estudio del estado del arte, construir un sistema que traduce requerimientos a consultas SQL, y desarrollar las mismas basado en la metadata de la base de datos. Se busca generar consultas semánticamente correctas y superar desafíos de generalización sobre la estructura de diversas bases de datos. Esta tesis se encamina en busca de una contribución al campo de Text-to-SQL, abordando desafíos prácticos en la generación automática de consultas SQL, que tiene aplicaciones prometedoras en la mejora de la colaboración y eficiencia en el desarrollo de sistemas.


Detalles Bibliográficos
2024
PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
INTELIGENCIA ARTIFICIAL
MODELOS DE LENGUAJE GRANDE
SQL
REDES NEURONALES
Español
Universidad ORT Uruguay
RAD
https://hdl.handle.net/20.500.11968/7029
http://hdl.handle.net/20.500.11968/7029
Acceso abierto
Acceso abierto
_version_ 1816774023112032256
author Leon Fariña, Gonzalo Rodrigo de
author2 Ljubicic Román, Martín Pablo
Oldán Motta, Joaquín
author2_role author
author
author_facet Leon Fariña, Gonzalo Rodrigo de
Ljubicic Román, Martín Pablo
Oldán Motta, Joaquín
author_role author
bitstream.checksum.fl_str_mv f05f56f4881a84ee0371917ea99c5b33
0e95fe187dc981c067b9cdfa58f6e70c
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
bitstream.url.fl_str_mv https://rad.ort.edu.uy/bitstreams/2e9db52d-f3f9-4920-b790-d4d9ac35cd37/download
https://rad.ort.edu.uy/bitstreams/fa11194a-73e8-493b-9ba9-67e793719e79/download
collection RAD
dc.contributor.tribunal.none.fl_str_mv Braberman, Victor Adrian
Rodriguez Pedreira, Juan Andrés
dc.creator.advisor.none.fl_str_mv Mayr Ojeda, Franz
dc.creator.none.fl_str_mv Leon Fariña, Gonzalo Rodrigo de
Ljubicic Román, Martín Pablo
Oldán Motta, Joaquín
dc.date.accessioned.none.fl_str_mv 2024-08-22T16:07:41Z
dc.date.available.none.fl_str_mv 2024-08-22T16:07:41Z
dc.date.issued.none.fl_str_mv 2024
dc.description.abstract.none.fl_txt_mv El presente trabajo final tiene como objetivo desarrollar un asistente basado en un Large Lenguage Model (LLM) para facilitar la comprensión de sistemas a desarrolladores ciudadanos o "citizen developers" para que puedan igualmente desenvolverse en el área; testers y analistas funcionales, mediante la generación inteligente de consultas SQL a partir de lenguaje natural. El énfasis cae en el acceso a datos, implementando técnicas como Retrieval Augmented Generation (RAG), few-shot learning, chain of though sobre modelos locales para mejorar la precisión en la generación de consultas. Una complejidad del proyecto se presenta en la gestión de una base de datos con gran número de tablas y atributos de manera completamente local. El enfoque es un estudio del estado del arte, construir un sistema que traduce requerimientos a consultas SQL, y desarrollar las mismas basado en la metadata de la base de datos. Se busca generar consultas semánticamente correctas y superar desafíos de generalización sobre la estructura de diversas bases de datos. Esta tesis se encamina en busca de una contribución al campo de Text-to-SQL, abordando desafíos prácticos en la generación automática de consultas SQL, que tiene aplicaciones prometedoras en la mejora de la colaboración y eficiencia en el desarrollo de sistemas.
dc.description.none.fl_txt_mv Incluye bibliografía y anexos.
dc.format.extent.none.fl_str_mv 92 p. diagrs., grafs.
dc.format.mimetype.none.fl_str_mv PDF
dc.identifier.citation.none.fl_str_mv Leon Fariña, G. R. de, Ljubicic Román, M. P. & Oldán Motta, J. (2024). Un Estudio de Text-to-SQL con Grandes: Modelo de Lenguaje (Trabajo final) Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/7029
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.11968/7029
http://hdl.handle.net/20.500.11968/7029
dc.language.iso.none.fl_str_mv spa
dc.publisher.none.fl_str_mv Universidad ORT Uruguay
dc.relation.other.none.fl_str_mv https://sisbibliotecas.ort.edu.uy/bib/95819
dc.rights.license.none.fl_str_mv Acceso abierto
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:RAD
instname:Universidad ORT Uruguay
instacron:Universidad ORT
dc.subject.none.fl_str_mv PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
INTELIGENCIA ARTIFICIAL
MODELOS DE LENGUAJE GRANDE
SQL
REDES NEURONALES
dc.title.none.fl_str_mv Un Estudio de Text-to-SQL con Grandes
Modelo de Lenguaje
dc.type.none.fl_str_mv Trabajo final de carrera
info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
description Incluye bibliografía y anexos.
eu_rights_str_mv openAccess
format bachelorThesis
id RAD_24c01f4ad41d3b18b6ff76102b32e9d2
identifier_str_mv Leon Fariña, G. R. de, Ljubicic Román, M. P. & Oldán Motta, J. (2024). Un Estudio de Text-to-SQL con Grandes: Modelo de Lenguaje (Trabajo final) Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/7029
instacron_str Universidad ORT
institution Universidad ORT
instname_str Universidad ORT Uruguay
language spa
network_acronym_str RAD
network_name_str RAD
oai_identifier_str oai:rad.ort.edu.uy:20.500.11968/7029
publishDate 2024
publisher.none.fl_str_mv Universidad ORT Uruguay
reponame_str RAD
repository.mail.fl_str_mv rodriguez_v@ort.edu.uy
repository.name.fl_str_mv RAD - Universidad ORT Uruguay
repository_id_str 3927
rights_invalid_str_mv Acceso abierto
spelling Braberman, Victor AdrianRodriguez Pedreira, Juan AndrésLeon Fariña, Gonzalo Rodrigo deLjubicic Román, Martín PabloOldán Motta, JoaquínMayr Ojeda, Franz2024-08-22T16:07:41Z2024-08-22T16:07:41Z2024Incluye bibliografía y anexos.El presente trabajo final tiene como objetivo desarrollar un asistente basado en un Large Lenguage Model (LLM) para facilitar la comprensión de sistemas a desarrolladores ciudadanos o "citizen developers" para que puedan igualmente desenvolverse en el área; testers y analistas funcionales, mediante la generación inteligente de consultas SQL a partir de lenguaje natural. El énfasis cae en el acceso a datos, implementando técnicas como Retrieval Augmented Generation (RAG), few-shot learning, chain of though sobre modelos locales para mejorar la precisión en la generación de consultas. Una complejidad del proyecto se presenta en la gestión de una base de datos con gran número de tablas y atributos de manera completamente local. El enfoque es un estudio del estado del arte, construir un sistema que traduce requerimientos a consultas SQL, y desarrollar las mismas basado en la metadata de la base de datos. Se busca generar consultas semánticamente correctas y superar desafíos de generalización sobre la estructura de diversas bases de datos. Esta tesis se encamina en busca de una contribución al campo de Text-to-SQL, abordando desafíos prácticos en la generación automática de consultas SQL, que tiene aplicaciones prometedoras en la mejora de la colaboración y eficiencia en el desarrollo de sistemas.92 p. diagrs., grafs. PDFLeon Fariña, G. R. de, Ljubicic Román, M. P. & Oldán Motta, J. (2024). Un Estudio de Text-to-SQL con Grandes: Modelo de Lenguaje (Trabajo final) Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/7029https://hdl.handle.net/20.500.11968/7029http://hdl.handle.net/20.500.11968/7029spaUniversidad ORT Uruguayhttps://sisbibliotecas.ort.edu.uy/bib/95819info:eu-repo/semantics/openAccessAcceso abiertoPROYECTOS-MDBIG DATAAPRENDIZAJE AUTOMÁTICOINTELIGENCIA ARTIFICIALMODELOS DE LENGUAJE GRANDESQLREDES NEURONALESUn Estudio de Text-to-SQL con GrandesModelo de LenguajeTrabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTFI - Master en Big Data - MDFacultad de IngenieríaMasterMaster en Big DataTrabajo finalTrabajo final (Master). Universidad ORT Uruguay, Facultad de IngenieríaORIGINALMateial completo.pdfMateial completo.pdfapplication/pdf3728010https://rad.ort.edu.uy/bitstreams/2e9db52d-f3f9-4920-b790-d4d9ac35cd37/downloadf05f56f4881a84ee0371917ea99c5b33MD51THUMBNAILMateial completo.pdf.jpgMateial completo.pdf.jpgGenerated Thumbnailimage/jpeg3411https://rad.ort.edu.uy/bitstreams/fa11194a-73e8-493b-9ba9-67e793719e79/download0e95fe187dc981c067b9cdfa58f6e70cMD5220.500.11968/70292024-11-22 15:16:39.947oai:rad.ort.edu.uy:20.500.11968/7029https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-11-22T15:16:39RAD - Universidad ORT Uruguayfalse
spellingShingle Un Estudio de Text-to-SQL con Grandes
Leon Fariña, Gonzalo Rodrigo de
PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
INTELIGENCIA ARTIFICIAL
MODELOS DE LENGUAJE GRANDE
SQL
REDES NEURONALES
status_str publishedVersion
title Un Estudio de Text-to-SQL con Grandes
title_full Un Estudio de Text-to-SQL con Grandes
title_fullStr Un Estudio de Text-to-SQL con Grandes
title_full_unstemmed Un Estudio de Text-to-SQL con Grandes
title_short Un Estudio de Text-to-SQL con Grandes
title_sort Un Estudio de Text-to-SQL con Grandes
topic PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
INTELIGENCIA ARTIFICIAL
MODELOS DE LENGUAJE GRANDE
SQL
REDES NEURONALES
url https://hdl.handle.net/20.500.11968/7029
http://hdl.handle.net/20.500.11968/7029