Generación de diálogo utilizando aprendizaje por refuerzo y redes neuronales adversarias

Bello, Andrés - Sclavi, Matías

Supervisor(es): Garat, Diego - Moncecchi, Guillermo

Resumen:

El procesamiento de lenguaje natural (PLN) intenta modelar la capacidad de los seres humanos para comunicarse entre sí. En el marco de esta área, nuestro trabajo tiene por objetivo la generación de diálogo escrito, particularmente entre dos personas de diferente género, mediante el uso de aprendizaje por refuerzo y redes generativas adversarias (GAN). Para lograr este objetivo se construye un corpus que contiene diálogos de películas en inglés, el cual se utiliza para entrenar dos agentes, uno por cada género. Ambos agentes están implementados como una tarea de aprendizaje por refuerzo, donde cada uno está constituido por dos modelos: un generador y un discriminador. El objetivo del generador es producir las respuestas a los diálogos, mientras que el discriminador tiene la tarea de distinguir si la respuesta es generada por un humano o por el modelo. La calidad de las respuestas generadas por los agentes es evaluada utilizando métricas basadas en heurísticas y mediante evaluación humana. Los resultados obtenidos en esta última muestran que 45% de las respuestas no son distinguidas como provenientes del modelo, mientras que las métricas basadas en heurísticas presentan que los agentes utilizados están por encima de la línea base, implementada utilizando la similitud semántica de las respuestas.


Detalles Bibliográficos
2020
Generación de diálogo
Aprendizaje por refuerzo
Redes generativas adversarias
Redes neuronales recurrentes
Español
Universidad de la República
COLIBRI
https://hdl.handle.net/20.500.12008/26187
Acceso abierto
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)