Herramientas para traducción automática Guaraní - Español

Borges, Yanina - Mercant, Florencia

Supervisor(es): Chiruzzo, Luis

Resumen:

Este trabajo se centra en la realización de una herramienta que contribuya a la traducción del guaraní al español. El guaraní es un idioma utilizado actualmente en diferentes países de América Latina, es un idioma aglutinante y polisintético que presenta muchas diferencias respecto al español y al inglés. El proyecto se divide en tres grandes partes. La primera consiste en la investigación de las herramientas y recursos existentes para la traducción del idioma guaraní al español. Se realizaron estudios acerca del idioma y su gramática, teniendo como eje principal de la investigación los verbos. La segunda parte consiste en elaborar herramientas que faciliten la traducción. Para esto se siguen tres grandes objetivos: realizar el análisis morfológico de verbos, detectar verbos y realizar experimentos de traducción automática guaraní-español. Para realizar el análisis de verbos se implementó una herramienta basada en reglas. La parte detección de verbos se desarrolló en base al método basado en reglas y experimentos basados en un modelo estadístico con Hidden Markov Model. Luego para la traducción automática se realizaron diferentes experimentos con un método basado en redes neuronales, mediante la herramienta OpenNMT e incorporando los conocimientos generados previamente. La última etapa del proyecto consiste en la evaluación de las herramientas implementadas.


Detalles Bibliográficos
2019
Idioma aglutinante
Idioma polisintético
Guaraní
Jopará
Procesamiento de lenguaje natural
Análisis morfológico
Análisis morfosintáctico
Part-of speech tagging
Aprendizaje basado en reglas
OpenNMT
Hidden Markov Model
Español
Universidad de la República
COLIBRI
https://hdl.handle.net/20.500.12008/24378
Acceso abierto
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
Resumen:
Sumario:Este trabajo se centra en la realización de una herramienta que contribuya a la traducción del guaraní al español. El guaraní es un idioma utilizado actualmente en diferentes países de América Latina, es un idioma aglutinante y polisintético que presenta muchas diferencias respecto al español y al inglés. El proyecto se divide en tres grandes partes. La primera consiste en la investigación de las herramientas y recursos existentes para la traducción del idioma guaraní al español. Se realizaron estudios acerca del idioma y su gramática, teniendo como eje principal de la investigación los verbos. La segunda parte consiste en elaborar herramientas que faciliten la traducción. Para esto se siguen tres grandes objetivos: realizar el análisis morfológico de verbos, detectar verbos y realizar experimentos de traducción automática guaraní-español. Para realizar el análisis de verbos se implementó una herramienta basada en reglas. La parte detección de verbos se desarrolló en base al método basado en reglas y experimentos basados en un modelo estadístico con Hidden Markov Model. Luego para la traducción automática se realizaron diferentes experimentos con un método basado en redes neuronales, mediante la herramienta OpenNMT e incorporando los conocimientos generados previamente. La última etapa del proyecto consiste en la evaluación de las herramientas implementadas.