Un Estudio de Text-to-SQL con Grandes
Modelo de Lenguaje
Supervisor(es): Mayr Ojeda, Franz
Resumen:
El presente trabajo final tiene como objetivo desarrollar un asistente basado en un Large Lenguage Model (LLM) para facilitar la comprensión de sistemas a desarrolladores ciudadanos o "citizen developers" para que puedan igualmente desenvolverse en el área; testers y analistas funcionales, mediante la generación inteligente de consultas SQL a partir de lenguaje natural. El énfasis cae en el acceso a datos, implementando técnicas como Retrieval Augmented Generation (RAG), few-shot learning, chain of though sobre modelos locales para mejorar la precisión en la generación de consultas. Una complejidad del proyecto se presenta en la gestión de una base de datos con gran número de tablas y atributos de manera completamente local. El enfoque es un estudio del estado del arte, construir un sistema que traduce requerimientos a consultas SQL, y desarrollar las mismas basado en la metadata de la base de datos. Se busca generar consultas semánticamente correctas y superar desafíos de generalización sobre la estructura de diversas bases de datos. Esta tesis se encamina en busca de una contribución al campo de Text-to-SQL, abordando desafíos prácticos en la generación automática de consultas SQL, que tiene aplicaciones prometedoras en la mejora de la colaboración y eficiencia en el desarrollo de sistemas.
2024 | |
PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO INTELIGENCIA ARTIFICIAL MODELOS DE LENGUAJE GRANDE SQL REDES NEURONALES |
|
Español | |
Universidad ORT Uruguay | |
RAD | |
https://hdl.handle.net/20.500.11968/7029
http://hdl.handle.net/20.500.11968/7029 |
|
Acceso abierto | |
Acceso abierto |
_version_ | 1816774023112032256 |
---|---|
author | Leon Fariña, Gonzalo Rodrigo de |
author2 | Ljubicic Román, Martín Pablo Oldán Motta, Joaquín |
author2_role | author author |
author_facet | Leon Fariña, Gonzalo Rodrigo de Ljubicic Román, Martín Pablo Oldán Motta, Joaquín |
author_role | author |
bitstream.checksum.fl_str_mv | f05f56f4881a84ee0371917ea99c5b33 0e95fe187dc981c067b9cdfa58f6e70c |
bitstream.checksumAlgorithm.fl_str_mv | MD5 MD5 |
bitstream.url.fl_str_mv | https://rad.ort.edu.uy/bitstreams/2e9db52d-f3f9-4920-b790-d4d9ac35cd37/download https://rad.ort.edu.uy/bitstreams/fa11194a-73e8-493b-9ba9-67e793719e79/download |
collection | RAD |
dc.contributor.tribunal.none.fl_str_mv | Braberman, Victor Adrian Rodriguez Pedreira, Juan Andrés |
dc.creator.advisor.none.fl_str_mv | Mayr Ojeda, Franz |
dc.creator.none.fl_str_mv | Leon Fariña, Gonzalo Rodrigo de Ljubicic Román, Martín Pablo Oldán Motta, Joaquín |
dc.date.accessioned.none.fl_str_mv | 2024-08-22T16:07:41Z |
dc.date.available.none.fl_str_mv | 2024-08-22T16:07:41Z |
dc.date.issued.none.fl_str_mv | 2024 |
dc.description.abstract.none.fl_txt_mv | El presente trabajo final tiene como objetivo desarrollar un asistente basado en un Large Lenguage Model (LLM) para facilitar la comprensión de sistemas a desarrolladores ciudadanos o "citizen developers" para que puedan igualmente desenvolverse en el área; testers y analistas funcionales, mediante la generación inteligente de consultas SQL a partir de lenguaje natural. El énfasis cae en el acceso a datos, implementando técnicas como Retrieval Augmented Generation (RAG), few-shot learning, chain of though sobre modelos locales para mejorar la precisión en la generación de consultas. Una complejidad del proyecto se presenta en la gestión de una base de datos con gran número de tablas y atributos de manera completamente local. El enfoque es un estudio del estado del arte, construir un sistema que traduce requerimientos a consultas SQL, y desarrollar las mismas basado en la metadata de la base de datos. Se busca generar consultas semánticamente correctas y superar desafíos de generalización sobre la estructura de diversas bases de datos. Esta tesis se encamina en busca de una contribución al campo de Text-to-SQL, abordando desafíos prácticos en la generación automática de consultas SQL, que tiene aplicaciones prometedoras en la mejora de la colaboración y eficiencia en el desarrollo de sistemas. |
dc.description.none.fl_txt_mv | Incluye bibliografía y anexos. |
dc.format.extent.none.fl_str_mv | 92 p. diagrs., grafs. |
dc.format.mimetype.none.fl_str_mv | PDF |
dc.identifier.citation.none.fl_str_mv | Leon Fariña, G. R. de, Ljubicic Román, M. P. & Oldán Motta, J. (2024). Un Estudio de Text-to-SQL con Grandes: Modelo de Lenguaje (Trabajo final) Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/7029 |
dc.identifier.uri.none.fl_str_mv | https://hdl.handle.net/20.500.11968/7029 http://hdl.handle.net/20.500.11968/7029 |
dc.language.iso.none.fl_str_mv | spa |
dc.publisher.none.fl_str_mv | Universidad ORT Uruguay |
dc.relation.other.none.fl_str_mv | https://sisbibliotecas.ort.edu.uy/bib/95819 |
dc.rights.license.none.fl_str_mv | Acceso abierto |
dc.rights.none.fl_str_mv | info:eu-repo/semantics/openAccess |
dc.source.none.fl_str_mv | reponame:RAD instname:Universidad ORT Uruguay instacron:Universidad ORT |
dc.subject.none.fl_str_mv | PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO INTELIGENCIA ARTIFICIAL MODELOS DE LENGUAJE GRANDE SQL REDES NEURONALES |
dc.title.none.fl_str_mv | Un Estudio de Text-to-SQL con Grandes Modelo de Lenguaje |
dc.type.none.fl_str_mv | Trabajo final de carrera info:eu-repo/semantics/bachelorThesis |
dc.type.version.none.fl_str_mv | info:eu-repo/semantics/publishedVersion |
description | Incluye bibliografía y anexos. |
eu_rights_str_mv | openAccess |
format | bachelorThesis |
id | RAD_24c01f4ad41d3b18b6ff76102b32e9d2 |
identifier_str_mv | Leon Fariña, G. R. de, Ljubicic Román, M. P. & Oldán Motta, J. (2024). Un Estudio de Text-to-SQL con Grandes: Modelo de Lenguaje (Trabajo final) Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/7029 |
instacron_str | Universidad ORT |
institution | Universidad ORT |
instname_str | Universidad ORT Uruguay |
language | spa |
network_acronym_str | RAD |
network_name_str | RAD |
oai_identifier_str | oai:rad.ort.edu.uy:20.500.11968/7029 |
publishDate | 2024 |
publisher.none.fl_str_mv | Universidad ORT Uruguay |
reponame_str | RAD |
repository.mail.fl_str_mv | rodriguez_v@ort.edu.uy |
repository.name.fl_str_mv | RAD - Universidad ORT Uruguay |
repository_id_str | 3927 |
rights_invalid_str_mv | Acceso abierto |
spelling | Braberman, Victor AdrianRodriguez Pedreira, Juan AndrésLeon Fariña, Gonzalo Rodrigo deLjubicic Román, Martín PabloOldán Motta, JoaquínMayr Ojeda, Franz2024-08-22T16:07:41Z2024-08-22T16:07:41Z2024Incluye bibliografía y anexos.El presente trabajo final tiene como objetivo desarrollar un asistente basado en un Large Lenguage Model (LLM) para facilitar la comprensión de sistemas a desarrolladores ciudadanos o "citizen developers" para que puedan igualmente desenvolverse en el área; testers y analistas funcionales, mediante la generación inteligente de consultas SQL a partir de lenguaje natural. El énfasis cae en el acceso a datos, implementando técnicas como Retrieval Augmented Generation (RAG), few-shot learning, chain of though sobre modelos locales para mejorar la precisión en la generación de consultas. Una complejidad del proyecto se presenta en la gestión de una base de datos con gran número de tablas y atributos de manera completamente local. El enfoque es un estudio del estado del arte, construir un sistema que traduce requerimientos a consultas SQL, y desarrollar las mismas basado en la metadata de la base de datos. Se busca generar consultas semánticamente correctas y superar desafíos de generalización sobre la estructura de diversas bases de datos. Esta tesis se encamina en busca de una contribución al campo de Text-to-SQL, abordando desafíos prácticos en la generación automática de consultas SQL, que tiene aplicaciones prometedoras en la mejora de la colaboración y eficiencia en el desarrollo de sistemas.92 p. diagrs., grafs. PDFLeon Fariña, G. R. de, Ljubicic Román, M. P. & Oldán Motta, J. (2024). Un Estudio de Text-to-SQL con Grandes: Modelo de Lenguaje (Trabajo final) Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/7029https://hdl.handle.net/20.500.11968/7029http://hdl.handle.net/20.500.11968/7029spaUniversidad ORT Uruguayhttps://sisbibliotecas.ort.edu.uy/bib/95819info:eu-repo/semantics/openAccessAcceso abiertoPROYECTOS-MDBIG DATAAPRENDIZAJE AUTOMÁTICOINTELIGENCIA ARTIFICIALMODELOS DE LENGUAJE GRANDESQLREDES NEURONALESUn Estudio de Text-to-SQL con GrandesModelo de LenguajeTrabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTFI - Master en Big Data - MDFacultad de IngenieríaMasterMaster en Big DataTrabajo finalTrabajo final (Master). Universidad ORT Uruguay, Facultad de IngenieríaORIGINALMateial completo.pdfMateial completo.pdfapplication/pdf3728010https://rad.ort.edu.uy/bitstreams/2e9db52d-f3f9-4920-b790-d4d9ac35cd37/downloadf05f56f4881a84ee0371917ea99c5b33MD51THUMBNAILMateial completo.pdf.jpgMateial completo.pdf.jpgGenerated Thumbnailimage/jpeg3411https://rad.ort.edu.uy/bitstreams/fa11194a-73e8-493b-9ba9-67e793719e79/download0e95fe187dc981c067b9cdfa58f6e70cMD5220.500.11968/70292024-11-22 15:16:39.947oai:rad.ort.edu.uy:20.500.11968/7029https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-11-22T15:16:39RAD - Universidad ORT Uruguayfalse |
spellingShingle | Un Estudio de Text-to-SQL con Grandes Leon Fariña, Gonzalo Rodrigo de PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO INTELIGENCIA ARTIFICIAL MODELOS DE LENGUAJE GRANDE SQL REDES NEURONALES |
status_str | publishedVersion |
title | Un Estudio de Text-to-SQL con Grandes |
title_full | Un Estudio de Text-to-SQL con Grandes |
title_fullStr | Un Estudio de Text-to-SQL con Grandes |
title_full_unstemmed | Un Estudio de Text-to-SQL con Grandes |
title_short | Un Estudio de Text-to-SQL con Grandes |
title_sort | Un Estudio de Text-to-SQL con Grandes |
topic | PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO INTELIGENCIA ARTIFICIAL MODELOS DE LENGUAJE GRANDE SQL REDES NEURONALES |
url | https://hdl.handle.net/20.500.11968/7029 http://hdl.handle.net/20.500.11968/7029 |