CorrG-RS : sistemas de recomendación basados en redes neuronales sobre grafos de correlación.
Supervisor(es): Larroca, Federico - Capdehourat, Germán
Resumen:
Los Sistemas de Recomendación (RS por sus siglas en inglés) están cada vez más presentes en la vida diaria de las personas. Redes sociales, plataformas de e-commerce o de streaming son solo algunas de las organizaciones que dependen de estos sistemas para recomendar contenido y productos a sus usuarios. De esta manera pueden mejorar la experiencia en línea del usuario así como también aumentar sus utilidades o inducir a los usuarios a generar y consumir más contenido mediante la captación de su atención. Al igual que en otras áreas del Aprendizaje Automático (i.e. Machine Learning, ML), como el Procesamiento de Lenguaje Natural o la Visión Artificial, los RS se vieron revolucionados por las técnicas de Aprendizaje Profundo (i.e. Deep Learning, DL), pasando de basarse en métodos clásicos como la factorización de matrices a modelos basados en redes neuronales profundas. El ML para datos en grafos también se vio sacudido por el DL, desarrollándose así las Redes Neuronales sobre Grafos (GNN por sus siglas en inglés). Estas redes se basan en los mismos principios del DL pero sus arquitecturas se deben adaptar a la forma en que se representan los datos en un grafo. El objetivo principal de este trabajo es explorar la mayor capacidad de las GNN a la hora de implementar RS para datos en grafos. Para ello se trabajó con datos de la Biblioteca Ceibal, una biblioteca digital pública para beneficiarios de Ceibal y la población en general. En particular se utilizaron los datos de los usuarios adultos con el fin de implementar RS basados en GNN sobre grafos de correlación, denominado aquí como el modelo CorrG-RS. Se formuló el problema como uno de clasificación binaria para decidir si a un usuario le gustaría determinado ítem o no y a partir de ello realizar recomendaciones. Esta forma de modelar el problema resulta de interés por lo novedoso respecto a la literatura consultada y a la mayor variedad de métricas disponibles a la hora de evaluar los RS. Con ese fin se implementaron las aquí llamadas métricas tradicionales y métricas alternativas. Las primeras capaces de evaluar aspectos más bien objetivos de los resultados mientras que las segundas hacen lo propio en rasgos más bien subjetivos. Luego de entrenados, estos modelos fueron comparados con otros basados en métodos clásicos y en GNN sobre grafos de conocimiento. Se encontró que CorrG-RS es capaz de competir con ambas clases de métodos, teniendo como ventaja un buen desempeño computacional comparado con su par basado en grafos de conocimiento. También este modelo demostró las mejoras que puede introducir la fácil incorporación de atributos de los ítems a los entrenamientos, sin necesidad de llevar a cabo grandes procesamientos manuales de estos. Ambas características de CorrG-RS son prometedoras de cara a un futuro donde cada vez se tengan más fuentes de datos y la necesidad de integrarlos en un mismo sistema de recomendación.
2022 | |
Sistemas de recomendación Aprendizaje automático Biblioteca Grafos Aprendizaje profundo Redes neuronales sobre grafos Graph signal processing Ceibal Biblioteca país |
|
Inglés | |
Universidad de la República | |
COLIBRI | |
https://hdl.handle.net/20.500.12008/37365 | |
Acceso abierto | |
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0) |
Sumario: | Los Sistemas de Recomendación (RS por sus siglas en inglés) están cada vez más presentes en la vida diaria de las personas. Redes sociales, plataformas de e-commerce o de streaming son solo algunas de las organizaciones que dependen de estos sistemas para recomendar contenido y productos a sus usuarios. De esta manera pueden mejorar la experiencia en línea del usuario así como también aumentar sus utilidades o inducir a los usuarios a generar y consumir más contenido mediante la captación de su atención. Al igual que en otras áreas del Aprendizaje Automático (i.e. Machine Learning, ML), como el Procesamiento de Lenguaje Natural o la Visión Artificial, los RS se vieron revolucionados por las técnicas de Aprendizaje Profundo (i.e. Deep Learning, DL), pasando de basarse en métodos clásicos como la factorización de matrices a modelos basados en redes neuronales profundas. El ML para datos en grafos también se vio sacudido por el DL, desarrollándose así las Redes Neuronales sobre Grafos (GNN por sus siglas en inglés). Estas redes se basan en los mismos principios del DL pero sus arquitecturas se deben adaptar a la forma en que se representan los datos en un grafo. El objetivo principal de este trabajo es explorar la mayor capacidad de las GNN a la hora de implementar RS para datos en grafos. Para ello se trabajó con datos de la Biblioteca Ceibal, una biblioteca digital pública para beneficiarios de Ceibal y la población en general. En particular se utilizaron los datos de los usuarios adultos con el fin de implementar RS basados en GNN sobre grafos de correlación, denominado aquí como el modelo CorrG-RS. Se formuló el problema como uno de clasificación binaria para decidir si a un usuario le gustaría determinado ítem o no y a partir de ello realizar recomendaciones. Esta forma de modelar el problema resulta de interés por lo novedoso respecto a la literatura consultada y a la mayor variedad de métricas disponibles a la hora de evaluar los RS. Con ese fin se implementaron las aquí llamadas métricas tradicionales y métricas alternativas. Las primeras capaces de evaluar aspectos más bien objetivos de los resultados mientras que las segundas hacen lo propio en rasgos más bien subjetivos. Luego de entrenados, estos modelos fueron comparados con otros basados en métodos clásicos y en GNN sobre grafos de conocimiento. Se encontró que CorrG-RS es capaz de competir con ambas clases de métodos, teniendo como ventaja un buen desempeño computacional comparado con su par basado en grafos de conocimiento. También este modelo demostró las mejoras que puede introducir la fácil incorporación de atributos de los ítems a los entrenamientos, sin necesidad de llevar a cabo grandes procesamientos manuales de estos. Ambas características de CorrG-RS son prometedoras de cara a un futuro donde cada vez se tengan más fuentes de datos y la necesidad de integrarlos en un mismo sistema de recomendación. |
---|