Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales

Derderian Dostourian, Mariana - Milano Taibo, José Germán - Mottini d'Oliveira, Bruno Luis

Resumen:

El presente trabajo final tiene como objetivo investigar las posibilidades que brinda la Inteligencia Artificial. En particular, se focaliza en analizar las diferentes técnicas de “Batch Reinforcement Learning” pasivo. Su implementación buscará abordar un caso de uso real basado en sistemas de recomendación. Esto implicó la realización de una evaluación de los diferentes algoritmos capaces de resolver esta y otras problemáticas, así como también las diferentes opciones de métricas de desempeño que pueden ser implementadas. Así, se buscará generar un marco de referencia para la aplicación de “Batch Reinforcement Learning”. El mismo abordará los siguientes pilares fundacionales: tratamiento del conjunto de datos, los algoritmos y posibles métricas de desempeño. Estos puntos forman un grupo indispensable para la aplicación de la técnica antes mencionada. Estos tres pilares se abordarán desde distintas ópticas. Por una parte, en lo que refiere a conjunto de datos, se utilizarán algoritmos que permitirán generarlos para mantener un escenario de pruebas controlado, sobre el cual puedan desarrollarse distintos experimentos. Por otra parte, se explorarán algoritmos que se consideran las bases para la aplicación de “Batch Reinforcement Learning” pasivo (e.g. Neural Fitted Q-Iteration), todos ellos basados en redes neuronales artificiales. Por último, será necesario evaluar métricas de desempeño que permitan conocer si un agente logró aprender a resolver la tarea propuesta. Finalmente, se dejan sentadas las bases para poder aplicar dichas técnicas a un caso real sobre una temática relevante en la industria: sistemas de recomendación.


Detalles Bibliográficos
2021
PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
APRENDIZAJE PROFUNDO
INTELIGENCIA ARTIFICIAL
APRENDIZAJE POR REFUERZO
Español
Universidad ORT Uruguay
RAD
http://hdl.handle.net/20.500.11968/4501
Acceso abierto
_version_ 1807261360792272896
author Derderian Dostourian, Mariana
author2 Milano Taibo, José Germán
Mottini d'Oliveira, Bruno Luis
author2_role author
author
author_facet Derderian Dostourian, Mariana
Milano Taibo, José Germán
Mottini d'Oliveira, Bruno Luis
author_role author
bitstream.checksum.fl_str_mv 56beb2927055e6687518f1ae3230569c
eff45a786c08dcab35e5ed2ec6122b73
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
bitstream.url.fl_str_mv https://rad.ort.edu.uy/bitstreams/70feb35a-e8be-4e6b-a197-6d2a2ca33c60/download
https://rad.ort.edu.uy/bitstreams/8a08e00c-c893-4858-973e-446364a3f011/download
collection RAD
dc.contributor.advisor.none.fl_str_mv Yovine, Sergio Fabián
Mayr Ojeda, Franz
dc.contributor.tribunal.none.fl_str_mv Gravano, Agustin
Olloniego Rocca, Juan Andrés
dc.creator.none.fl_str_mv Derderian Dostourian, Mariana
Milano Taibo, José Germán
Mottini d'Oliveira, Bruno Luis
dc.date.accessioned.none.fl_str_mv 2021-11-03T07:31:29Z
dc.date.available.none.fl_str_mv 2021-11-03T07:31:29Z
dc.date.issued.none.fl_str_mv 2021
dc.description.abstract.none.fl_txt_mv El presente trabajo final tiene como objetivo investigar las posibilidades que brinda la Inteligencia Artificial. En particular, se focaliza en analizar las diferentes técnicas de “Batch Reinforcement Learning” pasivo. Su implementación buscará abordar un caso de uso real basado en sistemas de recomendación. Esto implicó la realización de una evaluación de los diferentes algoritmos capaces de resolver esta y otras problemáticas, así como también las diferentes opciones de métricas de desempeño que pueden ser implementadas. Así, se buscará generar un marco de referencia para la aplicación de “Batch Reinforcement Learning”. El mismo abordará los siguientes pilares fundacionales: tratamiento del conjunto de datos, los algoritmos y posibles métricas de desempeño. Estos puntos forman un grupo indispensable para la aplicación de la técnica antes mencionada. Estos tres pilares se abordarán desde distintas ópticas. Por una parte, en lo que refiere a conjunto de datos, se utilizarán algoritmos que permitirán generarlos para mantener un escenario de pruebas controlado, sobre el cual puedan desarrollarse distintos experimentos. Por otra parte, se explorarán algoritmos que se consideran las bases para la aplicación de “Batch Reinforcement Learning” pasivo (e.g. Neural Fitted Q-Iteration), todos ellos basados en redes neuronales artificiales. Por último, será necesario evaluar métricas de desempeño que permitan conocer si un agente logró aprender a resolver la tarea propuesta. Finalmente, se dejan sentadas las bases para poder aplicar dichas técnicas a un caso real sobre una temática relevante en la industria: sistemas de recomendación.
dc.description.none.fl_txt_mv Incluye bibliografía y anexos.
dc.format.extent.none.fl_str_mv 88 p. diagrs., tbls., grafs.
dc.identifier.citation.none.fl_str_mv Derderian Dostourian, M., Milano Taibo, J. G., & Mottini d'Oliveira, B. L. (2021). Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.11968/4501
http://hdl.handle.net/20.500.11968/4501
dc.language.iso.none.fl_str_mv Español.
spa
dc.publisher.none.fl_str_mv Universidad ORT Uruguay
dc.relation.other.none.fl_str_mv https://sisbibliotecas.ort.edu.uy/bib/91824
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:RAD
instname:Universidad ORT Uruguay
instacron:Universidad ORT
dc.subject.none.fl_str_mv PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
APRENDIZAJE PROFUNDO
INTELIGENCIA ARTIFICIAL
APRENDIZAJE POR REFUERZO
dc.title.none.fl_str_mv Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales
dc.type.none.fl_str_mv Trabajo final de carrera
info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
description Incluye bibliografía y anexos.
eu_rights_str_mv openAccess
format bachelorThesis
id RAD_11100d827c0b46f73952e69da5fa410f
identifier_str_mv Derderian Dostourian, M., Milano Taibo, J. G., & Mottini d'Oliveira, B. L. (2021). Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.
instacron_str Universidad ORT
institution Universidad ORT
instname_str Universidad ORT Uruguay
language spa
language_invalid_str_mv Español.
network_acronym_str RAD
network_name_str RAD
oai_identifier_str oai:rad.ort.edu.uy:20.500.11968/4501
publishDate 2021
publisher.none.fl_str_mv Universidad ORT Uruguay
reponame_str RAD
repository.mail.fl_str_mv rodriguez_v@ort.edu.uy
repository.name.fl_str_mv RAD - Universidad ORT Uruguay
repository_id_str 3927
spelling Yovine, Sergio FabiánMayr Ojeda, FranzGravano, AgustinOlloniego Rocca, Juan AndrésDerderian Dostourian, MarianaMilano Taibo, José GermánMottini d'Oliveira, Bruno Luis2021-11-03T07:31:29Z2021-11-03T07:31:29Z2021Incluye bibliografía y anexos.El presente trabajo final tiene como objetivo investigar las posibilidades que brinda la Inteligencia Artificial. En particular, se focaliza en analizar las diferentes técnicas de “Batch Reinforcement Learning” pasivo. Su implementación buscará abordar un caso de uso real basado en sistemas de recomendación. Esto implicó la realización de una evaluación de los diferentes algoritmos capaces de resolver esta y otras problemáticas, así como también las diferentes opciones de métricas de desempeño que pueden ser implementadas. Así, se buscará generar un marco de referencia para la aplicación de “Batch Reinforcement Learning”. El mismo abordará los siguientes pilares fundacionales: tratamiento del conjunto de datos, los algoritmos y posibles métricas de desempeño. Estos puntos forman un grupo indispensable para la aplicación de la técnica antes mencionada. Estos tres pilares se abordarán desde distintas ópticas. Por una parte, en lo que refiere a conjunto de datos, se utilizarán algoritmos que permitirán generarlos para mantener un escenario de pruebas controlado, sobre el cual puedan desarrollarse distintos experimentos. Por otra parte, se explorarán algoritmos que se consideran las bases para la aplicación de “Batch Reinforcement Learning” pasivo (e.g. Neural Fitted Q-Iteration), todos ellos basados en redes neuronales artificiales. Por último, será necesario evaluar métricas de desempeño que permitan conocer si un agente logró aprender a resolver la tarea propuesta. Finalmente, se dejan sentadas las bases para poder aplicar dichas técnicas a un caso real sobre una temática relevante en la industria: sistemas de recomendación.88 p. diagrs., tbls., grafs.Derderian Dostourian, M., Milano Taibo, J. G., & Mottini d'Oliveira, B. L. (2021). Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.http://hdl.handle.net/20.500.11968/4501http://hdl.handle.net/20.500.11968/4501Español.spaUniversidad ORT Uruguayhttps://sisbibliotecas.ort.edu.uy/bib/91824PROYECTOS-MDBIG DATAAPRENDIZAJE AUTOMÁTICOAPRENDIZAJE PROFUNDOINTELIGENCIA ARTIFICIALAPRENDIZAJE POR REFUERZOAnálisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos realesTrabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTinfo:eu-repo/semantics/openAccessFI - Master en Big Data - MDFacultad de IngenieríaMasterMaster en Big DataTrabajo finalTrabajo final (Master). Universidad ORT Uruguay, Facultad de IngenieríaTHUMBNAILMaterial completo.pdf.jpgMaterial completo.pdf.jpgGenerated Thumbnailimage/jpeg3976https://rad.ort.edu.uy/bitstreams/70feb35a-e8be-4e6b-a197-6d2a2ca33c60/download56beb2927055e6687518f1ae3230569cMD53ORIGINALMaterial completo.pdfMaterial completo.pdfdescriptionapplication/pdf1438839https://rad.ort.edu.uy/bitstreams/8a08e00c-c893-4858-973e-446364a3f011/downloadeff45a786c08dcab35e5ed2ec6122b73MD5120.500.11968/45012024-07-22 15:50:40.191oai:rad.ort.edu.uy:20.500.11968/4501https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-07-22T15:50:40RAD - Universidad ORT Uruguayfalse
spellingShingle Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales
Derderian Dostourian, Mariana
PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
APRENDIZAJE PROFUNDO
INTELIGENCIA ARTIFICIAL
APRENDIZAJE POR REFUERZO
status_str publishedVersion
title Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales
title_full Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales
title_fullStr Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales
title_full_unstemmed Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales
title_short Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales
title_sort Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales
topic PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
APRENDIZAJE PROFUNDO
INTELIGENCIA ARTIFICIAL
APRENDIZAJE POR REFUERZO
url http://hdl.handle.net/20.500.11968/4501