Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales
Resumen:
El presente trabajo final tiene como objetivo investigar las posibilidades que brinda la Inteligencia Artificial. En particular, se focaliza en analizar las diferentes técnicas de “Batch Reinforcement Learning” pasivo. Su implementación buscará abordar un caso de uso real basado en sistemas de recomendación. Esto implicó la realización de una evaluación de los diferentes algoritmos capaces de resolver esta y otras problemáticas, así como también las diferentes opciones de métricas de desempeño que pueden ser implementadas. Así, se buscará generar un marco de referencia para la aplicación de “Batch Reinforcement Learning”. El mismo abordará los siguientes pilares fundacionales: tratamiento del conjunto de datos, los algoritmos y posibles métricas de desempeño. Estos puntos forman un grupo indispensable para la aplicación de la técnica antes mencionada. Estos tres pilares se abordarán desde distintas ópticas. Por una parte, en lo que refiere a conjunto de datos, se utilizarán algoritmos que permitirán generarlos para mantener un escenario de pruebas controlado, sobre el cual puedan desarrollarse distintos experimentos. Por otra parte, se explorarán algoritmos que se consideran las bases para la aplicación de “Batch Reinforcement Learning” pasivo (e.g. Neural Fitted Q-Iteration), todos ellos basados en redes neuronales artificiales. Por último, será necesario evaluar métricas de desempeño que permitan conocer si un agente logró aprender a resolver la tarea propuesta. Finalmente, se dejan sentadas las bases para poder aplicar dichas técnicas a un caso real sobre una temática relevante en la industria: sistemas de recomendación.
2021 | |
PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO APRENDIZAJE PROFUNDO INTELIGENCIA ARTIFICIAL APRENDIZAJE POR REFUERZO |
|
Español | |
Universidad ORT Uruguay | |
RAD | |
http://hdl.handle.net/20.500.11968/4501 | |
Acceso abierto |
_version_ | 1807261360792272896 |
---|---|
author | Derderian Dostourian, Mariana |
author2 | Milano Taibo, José Germán Mottini d'Oliveira, Bruno Luis |
author2_role | author author |
author_facet | Derderian Dostourian, Mariana Milano Taibo, José Germán Mottini d'Oliveira, Bruno Luis |
author_role | author |
bitstream.checksum.fl_str_mv | 56beb2927055e6687518f1ae3230569c eff45a786c08dcab35e5ed2ec6122b73 |
bitstream.checksumAlgorithm.fl_str_mv | MD5 MD5 |
bitstream.url.fl_str_mv | https://rad.ort.edu.uy/bitstreams/70feb35a-e8be-4e6b-a197-6d2a2ca33c60/download https://rad.ort.edu.uy/bitstreams/8a08e00c-c893-4858-973e-446364a3f011/download |
collection | RAD |
dc.contributor.advisor.none.fl_str_mv | Yovine, Sergio Fabián Mayr Ojeda, Franz |
dc.contributor.tribunal.none.fl_str_mv | Gravano, Agustin Olloniego Rocca, Juan Andrés |
dc.creator.none.fl_str_mv | Derderian Dostourian, Mariana Milano Taibo, José Germán Mottini d'Oliveira, Bruno Luis |
dc.date.accessioned.none.fl_str_mv | 2021-11-03T07:31:29Z |
dc.date.available.none.fl_str_mv | 2021-11-03T07:31:29Z |
dc.date.issued.none.fl_str_mv | 2021 |
dc.description.abstract.none.fl_txt_mv | El presente trabajo final tiene como objetivo investigar las posibilidades que brinda la Inteligencia Artificial. En particular, se focaliza en analizar las diferentes técnicas de “Batch Reinforcement Learning” pasivo. Su implementación buscará abordar un caso de uso real basado en sistemas de recomendación. Esto implicó la realización de una evaluación de los diferentes algoritmos capaces de resolver esta y otras problemáticas, así como también las diferentes opciones de métricas de desempeño que pueden ser implementadas. Así, se buscará generar un marco de referencia para la aplicación de “Batch Reinforcement Learning”. El mismo abordará los siguientes pilares fundacionales: tratamiento del conjunto de datos, los algoritmos y posibles métricas de desempeño. Estos puntos forman un grupo indispensable para la aplicación de la técnica antes mencionada. Estos tres pilares se abordarán desde distintas ópticas. Por una parte, en lo que refiere a conjunto de datos, se utilizarán algoritmos que permitirán generarlos para mantener un escenario de pruebas controlado, sobre el cual puedan desarrollarse distintos experimentos. Por otra parte, se explorarán algoritmos que se consideran las bases para la aplicación de “Batch Reinforcement Learning” pasivo (e.g. Neural Fitted Q-Iteration), todos ellos basados en redes neuronales artificiales. Por último, será necesario evaluar métricas de desempeño que permitan conocer si un agente logró aprender a resolver la tarea propuesta. Finalmente, se dejan sentadas las bases para poder aplicar dichas técnicas a un caso real sobre una temática relevante en la industria: sistemas de recomendación. |
dc.description.none.fl_txt_mv | Incluye bibliografía y anexos. |
dc.format.extent.none.fl_str_mv | 88 p. diagrs., tbls., grafs. |
dc.identifier.citation.none.fl_str_mv | Derderian Dostourian, M., Milano Taibo, J. G., & Mottini d'Oliveira, B. L. (2021). Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería. |
dc.identifier.uri.none.fl_str_mv | http://hdl.handle.net/20.500.11968/4501 http://hdl.handle.net/20.500.11968/4501 |
dc.language.iso.none.fl_str_mv | Español. spa |
dc.publisher.none.fl_str_mv | Universidad ORT Uruguay |
dc.relation.other.none.fl_str_mv | https://sisbibliotecas.ort.edu.uy/bib/91824 |
dc.rights.none.fl_str_mv | info:eu-repo/semantics/openAccess |
dc.source.none.fl_str_mv | reponame:RAD instname:Universidad ORT Uruguay instacron:Universidad ORT |
dc.subject.none.fl_str_mv | PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO APRENDIZAJE PROFUNDO INTELIGENCIA ARTIFICIAL APRENDIZAJE POR REFUERZO |
dc.title.none.fl_str_mv | Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales |
dc.type.none.fl_str_mv | Trabajo final de carrera info:eu-repo/semantics/bachelorThesis |
dc.type.version.none.fl_str_mv | info:eu-repo/semantics/publishedVersion |
description | Incluye bibliografía y anexos. |
eu_rights_str_mv | openAccess |
format | bachelorThesis |
id | RAD_11100d827c0b46f73952e69da5fa410f |
identifier_str_mv | Derderian Dostourian, M., Milano Taibo, J. G., & Mottini d'Oliveira, B. L. (2021). Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería. |
instacron_str | Universidad ORT |
institution | Universidad ORT |
instname_str | Universidad ORT Uruguay |
language | spa |
language_invalid_str_mv | Español. |
network_acronym_str | RAD |
network_name_str | RAD |
oai_identifier_str | oai:rad.ort.edu.uy:20.500.11968/4501 |
publishDate | 2021 |
publisher.none.fl_str_mv | Universidad ORT Uruguay |
reponame_str | RAD |
repository.mail.fl_str_mv | rodriguez_v@ort.edu.uy |
repository.name.fl_str_mv | RAD - Universidad ORT Uruguay |
repository_id_str | 3927 |
spelling | Yovine, Sergio FabiánMayr Ojeda, FranzGravano, AgustinOlloniego Rocca, Juan AndrésDerderian Dostourian, MarianaMilano Taibo, José GermánMottini d'Oliveira, Bruno Luis2021-11-03T07:31:29Z2021-11-03T07:31:29Z2021Incluye bibliografía y anexos.El presente trabajo final tiene como objetivo investigar las posibilidades que brinda la Inteligencia Artificial. En particular, se focaliza en analizar las diferentes técnicas de “Batch Reinforcement Learning” pasivo. Su implementación buscará abordar un caso de uso real basado en sistemas de recomendación. Esto implicó la realización de una evaluación de los diferentes algoritmos capaces de resolver esta y otras problemáticas, así como también las diferentes opciones de métricas de desempeño que pueden ser implementadas. Así, se buscará generar un marco de referencia para la aplicación de “Batch Reinforcement Learning”. El mismo abordará los siguientes pilares fundacionales: tratamiento del conjunto de datos, los algoritmos y posibles métricas de desempeño. Estos puntos forman un grupo indispensable para la aplicación de la técnica antes mencionada. Estos tres pilares se abordarán desde distintas ópticas. Por una parte, en lo que refiere a conjunto de datos, se utilizarán algoritmos que permitirán generarlos para mantener un escenario de pruebas controlado, sobre el cual puedan desarrollarse distintos experimentos. Por otra parte, se explorarán algoritmos que se consideran las bases para la aplicación de “Batch Reinforcement Learning” pasivo (e.g. Neural Fitted Q-Iteration), todos ellos basados en redes neuronales artificiales. Por último, será necesario evaluar métricas de desempeño que permitan conocer si un agente logró aprender a resolver la tarea propuesta. Finalmente, se dejan sentadas las bases para poder aplicar dichas técnicas a un caso real sobre una temática relevante en la industria: sistemas de recomendación.88 p. diagrs., tbls., grafs.Derderian Dostourian, M., Milano Taibo, J. G., & Mottini d'Oliveira, B. L. (2021). Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.http://hdl.handle.net/20.500.11968/4501http://hdl.handle.net/20.500.11968/4501Español.spaUniversidad ORT Uruguayhttps://sisbibliotecas.ort.edu.uy/bib/91824PROYECTOS-MDBIG DATAAPRENDIZAJE AUTOMÁTICOAPRENDIZAJE PROFUNDOINTELIGENCIA ARTIFICIALAPRENDIZAJE POR REFUERZOAnálisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos realesTrabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTinfo:eu-repo/semantics/openAccessFI - Master en Big Data - MDFacultad de IngenieríaMasterMaster en Big DataTrabajo finalTrabajo final (Master). Universidad ORT Uruguay, Facultad de IngenieríaTHUMBNAILMaterial completo.pdf.jpgMaterial completo.pdf.jpgGenerated Thumbnailimage/jpeg3976https://rad.ort.edu.uy/bitstreams/70feb35a-e8be-4e6b-a197-6d2a2ca33c60/download56beb2927055e6687518f1ae3230569cMD53ORIGINALMaterial completo.pdfMaterial completo.pdfdescriptionapplication/pdf1438839https://rad.ort.edu.uy/bitstreams/8a08e00c-c893-4858-973e-446364a3f011/downloadeff45a786c08dcab35e5ed2ec6122b73MD5120.500.11968/45012024-07-22 15:50:40.191oai:rad.ort.edu.uy:20.500.11968/4501https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-07-22T15:50:40RAD - Universidad ORT Uruguayfalse |
spellingShingle | Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales Derderian Dostourian, Mariana PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO APRENDIZAJE PROFUNDO INTELIGENCIA ARTIFICIAL APRENDIZAJE POR REFUERZO |
status_str | publishedVersion |
title | Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales |
title_full | Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales |
title_fullStr | Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales |
title_full_unstemmed | Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales |
title_short | Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales |
title_sort | Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales |
topic | PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO APRENDIZAJE PROFUNDO INTELIGENCIA ARTIFICIAL APRENDIZAJE POR REFUERZO |
url | http://hdl.handle.net/20.500.11968/4501 |