Herramientas para traducción automática Guaraní - Español
Supervisor(es): Chiruzzo, Luis
Resumen:
Este trabajo se centra en la realización de una herramienta que contribuya a la traducción del guaraní al español. El guaraní es un idioma utilizado actualmente en diferentes países de América Latina, es un idioma aglutinante y polisintético que presenta muchas diferencias respecto al español y al inglés. El proyecto se divide en tres grandes partes. La primera consiste en la investigación de las herramientas y recursos existentes para la traducción del idioma guaraní al español. Se realizaron estudios acerca del idioma y su gramática, teniendo como eje principal de la investigación los verbos. La segunda parte consiste en elaborar herramientas que faciliten la traducción. Para esto se siguen tres grandes objetivos: realizar el análisis morfológico de verbos, detectar verbos y realizar experimentos de traducción automática guaraní-español. Para realizar el análisis de verbos se implementó una herramienta basada en reglas. La parte detección de verbos se desarrolló en base al método basado en reglas y experimentos basados en un modelo estadístico con Hidden Markov Model. Luego para la traducción automática se realizaron diferentes experimentos con un método basado en redes neuronales, mediante la herramienta OpenNMT e incorporando los conocimientos generados previamente. La última etapa del proyecto consiste en la evaluación de las herramientas implementadas.
2019 | |
Idioma aglutinante Idioma polisintético Guaraní Jopará Procesamiento de lenguaje natural Análisis morfológico Análisis morfosintáctico Part-of speech tagging Aprendizaje basado en reglas OpenNMT Hidden Markov Model |
|
Español | |
Universidad de la República | |
COLIBRI | |
https://hdl.handle.net/20.500.12008/24378 | |
Acceso abierto | |
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0) |
Sumario: | Este trabajo se centra en la realización de una herramienta que contribuya a la traducción del guaraní al español. El guaraní es un idioma utilizado actualmente en diferentes países de América Latina, es un idioma aglutinante y polisintético que presenta muchas diferencias respecto al español y al inglés. El proyecto se divide en tres grandes partes. La primera consiste en la investigación de las herramientas y recursos existentes para la traducción del idioma guaraní al español. Se realizaron estudios acerca del idioma y su gramática, teniendo como eje principal de la investigación los verbos. La segunda parte consiste en elaborar herramientas que faciliten la traducción. Para esto se siguen tres grandes objetivos: realizar el análisis morfológico de verbos, detectar verbos y realizar experimentos de traducción automática guaraní-español. Para realizar el análisis de verbos se implementó una herramienta basada en reglas. La parte detección de verbos se desarrolló en base al método basado en reglas y experimentos basados en un modelo estadístico con Hidden Markov Model. Luego para la traducción automática se realizaron diferentes experimentos con un método basado en redes neuronales, mediante la herramienta OpenNMT e incorporando los conocimientos generados previamente. La última etapa del proyecto consiste en la evaluación de las herramientas implementadas. |
---|