Estudio de cumplimiento ambiental aumentado por LLM y RAG

Chicatun, Mariano Ezequiel

Supervisor(es): Fabián Yovine, Sergio

Resumen:

El objetivo de este trabajo final es optimizar la validación del cumplimiento ambiental en grandes empresas de sectores como minería, petróleo, alimentación y papeleras, ya que el cumplimiento de leyes y estándares ambientales para estas industrias demandan mucho tiempo. Se utilizan técnicas de Inteligencia Artificial y Machine Learning para agilizar y mejorar este proceso. Se exploran técnicas avanzadas de Generación Aumentada por Recuperación (RAG), incluyendo variantes como Graph RAG y Hybrid RAG, y esquemas multiagente secuenciales y jerárquicos. para abordar problemas complejos relacionados con datos textuales no estructurados. Para implementar estos agentes, se utilizan frameworks como Langchain, LlamaIndex y LangGraph. Se utiliza Graph RAG ya que está ganando relevancia en aplicaciones prácticas y científicas, utilizando grafos para vincular información relevante y nodos de resumen que sintetizan temas similares, permitiendo responder preguntas generales y holísticas sobre los documentos. Se diseña una Prueba de Concepto (PoC) basada en una arquitectura de microservicios con tres componentes principales: un constructor de grafos, un generador de preguntas, y un sistema de QA (Question Answering). Estos componentes son modulares y pueden modificarse, mejorarse, escalarse y ejecutarse de manera independiente, lo que facilita el desacoplamiento del sistema. El constructor de grafos procesa la documentación normativa del proyecto y extrae los requisitos necesarios para garantizar el cumplimiento ambiental. El proceso de generación de preguntas, inspirado en el concepto de Chain-of- Questions, genera preguntas que cubren exhaustivamente el conjunto de datos para minimizar y acotar el espacio de búsqueda dentro de la documentación del proyecto en estudio. Finalmente, el sistema de QA genera respuestas basadas en estas preguntas, utilizando la documentación del proyecto en evaluación para determinar el cumplimiento ambiental.


Detalles Bibliográficos
2024
PROYECTOS-MD
INTELIGENCIA ARTIFICIAL
APRENDIZAJE AUTOMÁTICO
MODELOS DE LENGUAJE GRANDE
GENERACIÓN AUMENTADA POR RECUPERACIÓN (RAG)
EVALUACIÓN AMBIENTAL
Español
Universidad ORT Uruguay
RAD
https://hdl.handle.net/20.500.11968/7080
http://hdl.handle.net/20.500.11968/7080
Acceso abierto
Acceso abierto
_version_ 1816774023147683840
author Chicatun, Mariano Ezequiel
author_facet Chicatun, Mariano Ezequiel
author_role author
bitstream.checksum.fl_str_mv a38976c904013570f06cb6c782f08278
8ab00f8d6066b8bfa6e11d793fd51348
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
bitstream.url.fl_str_mv https://rad.ort.edu.uy/bitstreams/79d02243-5125-47ba-b48a-be39b2ab833e/download
https://rad.ort.edu.uy/bitstreams/313fc064-05b3-49a3-aca4-210e84584326/download
collection RAD
dc.contributor.tribunal.none.fl_str_mv Adrian Braberman, Victor
Visca Zanoni, Ramiro Eugenio
dc.creator.advisor.none.fl_str_mv Fabián Yovine, Sergio
dc.creator.none.fl_str_mv Chicatun, Mariano Ezequiel
dc.date.accessioned.none.fl_str_mv 2024-11-12T16:16:34Z
dc.date.available.none.fl_str_mv 2024-11-12T16:16:34Z
dc.date.issued.none.fl_str_mv 2024
dc.description.abstract.none.fl_txt_mv El objetivo de este trabajo final es optimizar la validación del cumplimiento ambiental en grandes empresas de sectores como minería, petróleo, alimentación y papeleras, ya que el cumplimiento de leyes y estándares ambientales para estas industrias demandan mucho tiempo. Se utilizan técnicas de Inteligencia Artificial y Machine Learning para agilizar y mejorar este proceso. Se exploran técnicas avanzadas de Generación Aumentada por Recuperación (RAG), incluyendo variantes como Graph RAG y Hybrid RAG, y esquemas multiagente secuenciales y jerárquicos. para abordar problemas complejos relacionados con datos textuales no estructurados. Para implementar estos agentes, se utilizan frameworks como Langchain, LlamaIndex y LangGraph. Se utiliza Graph RAG ya que está ganando relevancia en aplicaciones prácticas y científicas, utilizando grafos para vincular información relevante y nodos de resumen que sintetizan temas similares, permitiendo responder preguntas generales y holísticas sobre los documentos. Se diseña una Prueba de Concepto (PoC) basada en una arquitectura de microservicios con tres componentes principales: un constructor de grafos, un generador de preguntas, y un sistema de QA (Question Answering). Estos componentes son modulares y pueden modificarse, mejorarse, escalarse y ejecutarse de manera independiente, lo que facilita el desacoplamiento del sistema. El constructor de grafos procesa la documentación normativa del proyecto y extrae los requisitos necesarios para garantizar el cumplimiento ambiental. El proceso de generación de preguntas, inspirado en el concepto de Chain-of- Questions, genera preguntas que cubren exhaustivamente el conjunto de datos para minimizar y acotar el espacio de búsqueda dentro de la documentación del proyecto en estudio. Finalmente, el sistema de QA genera respuestas basadas en estas preguntas, utilizando la documentación del proyecto en evaluación para determinar el cumplimiento ambiental.
dc.description.none.fl_txt_mv Incluye bibliografía.
dc.format.extent.none.fl_str_mv 66 p. diagrs., tabls.
dc.format.mimetype.none.fl_str_mv PDF
dc.identifier.citation.none.fl_str_mv Chicatun, M. E. (2024). Estudio de cumplimiento ambiental aumentado por LLM y RAG (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/7080
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.11968/7080
http://hdl.handle.net/20.500.11968/7080
dc.language.iso.none.fl_str_mv spa
dc.publisher.none.fl_str_mv Universidad ORT Uruguay
dc.relation.other.none.fl_str_mv https://sisbibliotecas.ort.edu.uy/bib/96370
dc.rights.license.none.fl_str_mv Acceso abierto
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:RAD
instname:Universidad ORT Uruguay
instacron:Universidad ORT
dc.subject.none.fl_str_mv PROYECTOS-MD
INTELIGENCIA ARTIFICIAL
APRENDIZAJE AUTOMÁTICO
MODELOS DE LENGUAJE GRANDE
GENERACIÓN AUMENTADA POR RECUPERACIÓN (RAG)
EVALUACIÓN AMBIENTAL
dc.title.none.fl_str_mv Estudio de cumplimiento ambiental aumentado por LLM y RAG
dc.type.none.fl_str_mv Trabajo final de carrera
info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
description Incluye bibliografía.
eu_rights_str_mv openAccess
format bachelorThesis
id RAD_002c9f47c781c044c6629b7d53d7e6bd
identifier_str_mv Chicatun, M. E. (2024). Estudio de cumplimiento ambiental aumentado por LLM y RAG (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/7080
instacron_str Universidad ORT
institution Universidad ORT
instname_str Universidad ORT Uruguay
language spa
network_acronym_str RAD
network_name_str RAD
oai_identifier_str oai:rad.ort.edu.uy:20.500.11968/7080
publishDate 2024
publisher.none.fl_str_mv Universidad ORT Uruguay
reponame_str RAD
repository.mail.fl_str_mv rodriguez_v@ort.edu.uy
repository.name.fl_str_mv RAD - Universidad ORT Uruguay
repository_id_str 3927
rights_invalid_str_mv Acceso abierto
spelling Adrian Braberman, VictorVisca Zanoni, Ramiro EugenioChicatun, Mariano EzequielFabián Yovine, Sergio2024-11-12T16:16:34Z2024-11-12T16:16:34Z2024Incluye bibliografía.El objetivo de este trabajo final es optimizar la validación del cumplimiento ambiental en grandes empresas de sectores como minería, petróleo, alimentación y papeleras, ya que el cumplimiento de leyes y estándares ambientales para estas industrias demandan mucho tiempo. Se utilizan técnicas de Inteligencia Artificial y Machine Learning para agilizar y mejorar este proceso. Se exploran técnicas avanzadas de Generación Aumentada por Recuperación (RAG), incluyendo variantes como Graph RAG y Hybrid RAG, y esquemas multiagente secuenciales y jerárquicos. para abordar problemas complejos relacionados con datos textuales no estructurados. Para implementar estos agentes, se utilizan frameworks como Langchain, LlamaIndex y LangGraph. Se utiliza Graph RAG ya que está ganando relevancia en aplicaciones prácticas y científicas, utilizando grafos para vincular información relevante y nodos de resumen que sintetizan temas similares, permitiendo responder preguntas generales y holísticas sobre los documentos. Se diseña una Prueba de Concepto (PoC) basada en una arquitectura de microservicios con tres componentes principales: un constructor de grafos, un generador de preguntas, y un sistema de QA (Question Answering). Estos componentes son modulares y pueden modificarse, mejorarse, escalarse y ejecutarse de manera independiente, lo que facilita el desacoplamiento del sistema. El constructor de grafos procesa la documentación normativa del proyecto y extrae los requisitos necesarios para garantizar el cumplimiento ambiental. El proceso de generación de preguntas, inspirado en el concepto de Chain-of- Questions, genera preguntas que cubren exhaustivamente el conjunto de datos para minimizar y acotar el espacio de búsqueda dentro de la documentación del proyecto en estudio. Finalmente, el sistema de QA genera respuestas basadas en estas preguntas, utilizando la documentación del proyecto en evaluación para determinar el cumplimiento ambiental.66 p. diagrs., tabls.PDFChicatun, M. E. (2024). Estudio de cumplimiento ambiental aumentado por LLM y RAG (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/7080https://hdl.handle.net/20.500.11968/7080http://hdl.handle.net/20.500.11968/7080spaUniversidad ORT Uruguayhttps://sisbibliotecas.ort.edu.uy/bib/96370info:eu-repo/semantics/openAccessAcceso abiertoPROYECTOS-MDINTELIGENCIA ARTIFICIALAPRENDIZAJE AUTOMÁTICOMODELOS DE LENGUAJE GRANDEGENERACIÓN AUMENTADA POR RECUPERACIÓN (RAG)EVALUACIÓN AMBIENTALEstudio de cumplimiento ambiental aumentado por LLM y RAGTrabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTFI - Master en Big Data - MDFacultad de IngenieríaCarrera universitariaMaster en Big DataTrabajo finalTrabajo final (Master). Universidad ORT Uruguay, Facultad de IngenieríaORIGINALMaterial completo.pdfMaterial completo.pdfapplication/pdf1975576https://rad.ort.edu.uy/bitstreams/79d02243-5125-47ba-b48a-be39b2ab833e/downloada38976c904013570f06cb6c782f08278MD51THUMBNAILMaterial completo.pdf.jpgMaterial completo.pdf.jpgGenerated Thumbnailimage/jpeg3366https://rad.ort.edu.uy/bitstreams/313fc064-05b3-49a3-aca4-210e84584326/download8ab00f8d6066b8bfa6e11d793fd51348MD5220.500.11968/70802024-11-22 15:17:51.118oai:rad.ort.edu.uy:20.500.11968/7080https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-11-22T15:17:51RAD - Universidad ORT Uruguayfalse
spellingShingle Estudio de cumplimiento ambiental aumentado por LLM y RAG
Chicatun, Mariano Ezequiel
PROYECTOS-MD
INTELIGENCIA ARTIFICIAL
APRENDIZAJE AUTOMÁTICO
MODELOS DE LENGUAJE GRANDE
GENERACIÓN AUMENTADA POR RECUPERACIÓN (RAG)
EVALUACIÓN AMBIENTAL
status_str publishedVersion
title Estudio de cumplimiento ambiental aumentado por LLM y RAG
title_full Estudio de cumplimiento ambiental aumentado por LLM y RAG
title_fullStr Estudio de cumplimiento ambiental aumentado por LLM y RAG
title_full_unstemmed Estudio de cumplimiento ambiental aumentado por LLM y RAG
title_short Estudio de cumplimiento ambiental aumentado por LLM y RAG
title_sort Estudio de cumplimiento ambiental aumentado por LLM y RAG
topic PROYECTOS-MD
INTELIGENCIA ARTIFICIAL
APRENDIZAJE AUTOMÁTICO
MODELOS DE LENGUAJE GRANDE
GENERACIÓN AUMENTADA POR RECUPERACIÓN (RAG)
EVALUACIÓN AMBIENTAL
url https://hdl.handle.net/20.500.11968/7080
http://hdl.handle.net/20.500.11968/7080