Evaluación y simplificación de textos para enseñanza de inglés

Noel Musso, Andrés Alexandre - Ruiz Colombato, Facundo Joaquín

Supervisor(es): Rosá, Aiala - Chiruzzo, Luis

Resumen:

La comunicación en la lengua inglesa es imprescindible en el mundo de hoy, la globalización ha hecho que así lo sea. El inglés es la lengua internacional, usada para escribir los estudios más recientes, viajar por el mundo y expandir nuestros emprendimientos permitiendo la comunicación con personas de otro país en este lenguaje universal. El proyecto presentado en este informe busca continuar con una línea de trabajo de investigación e implementación de herramientas de apoyo a la enseñanza de inglés para proveer a las escuelas. En esta oportunidad, se presenta una investigación acompañada con el desarrollo de herramientas con técnicas de Procesamiento de Lenguaje Natural para poder evaluar y simplificar textos en inglés con el objetivo de saber si son acordes al nivel necesario para que los estudiantes puedan aprender. Los textos fueron evaluados por la herramienta implementada para determinar su grado de complejidad, y simplificados para mejorar el aprendizaje en esta etapa temprana. Se realizaron actividades de vinculación con estudiantes de la Facultad de Información y Comunicación, que en conjunto con una lingüista, trabajaban sobre la simplificación de textos. En estas reuniones se generaron ideas y aspectos claves a considerar cuando se simplifica. Distintas métricas de evaluación fueron puestas a prueba contra grandes cantidades de textos de distintas fuentes, clasificados por profesionales según su complejidad. Luego de elegir técnicas fiables para evaluar textos, estos fueron simplificados y se volvieron a evaluar para estudiar la efectividad de los métodos de simplificación. Se experimentó con técnicas de simplificación de dos tipos: léxicas y sintácticas. Para realizar simplificación léxica, se identificaron palabras complejas con un clasificador SVM basado en vocabulario y se sustituyeron por palabras más simples con BERT-LS. BERT-LS toma en cuenta tanto el contexto del enunciado como la palabra compleja a la hora de generar candidatos para sustituir la palabra. Para realizar simplificación sintáctica, se aplicaron reglas para reducir la complejidad de los enunciados, que fueron previamente analizados sintácticamente. Finalmente, se considera que el trabajo realizado cumplió con los objetivos planteados al inicio del proyecto. Se logró implementar una herramienta para evaluar y simplificar textos que podrá facilitar el trabajo de la enseñanza de inglés en niños.


Detalles Bibliográficos
2022
Inglés
Procesamiento de lenguaje natural
ANEP
Support vector machine
word embeddings
Evaluación de textos
Simplificación de textos
BERT
Español
Universidad de la República
COLIBRI
https://hdl.handle.net/20.500.12008/34063
Acceso abierto
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
Resumen:
Sumario:La comunicación en la lengua inglesa es imprescindible en el mundo de hoy, la globalización ha hecho que así lo sea. El inglés es la lengua internacional, usada para escribir los estudios más recientes, viajar por el mundo y expandir nuestros emprendimientos permitiendo la comunicación con personas de otro país en este lenguaje universal. El proyecto presentado en este informe busca continuar con una línea de trabajo de investigación e implementación de herramientas de apoyo a la enseñanza de inglés para proveer a las escuelas. En esta oportunidad, se presenta una investigación acompañada con el desarrollo de herramientas con técnicas de Procesamiento de Lenguaje Natural para poder evaluar y simplificar textos en inglés con el objetivo de saber si son acordes al nivel necesario para que los estudiantes puedan aprender. Los textos fueron evaluados por la herramienta implementada para determinar su grado de complejidad, y simplificados para mejorar el aprendizaje en esta etapa temprana. Se realizaron actividades de vinculación con estudiantes de la Facultad de Información y Comunicación, que en conjunto con una lingüista, trabajaban sobre la simplificación de textos. En estas reuniones se generaron ideas y aspectos claves a considerar cuando se simplifica. Distintas métricas de evaluación fueron puestas a prueba contra grandes cantidades de textos de distintas fuentes, clasificados por profesionales según su complejidad. Luego de elegir técnicas fiables para evaluar textos, estos fueron simplificados y se volvieron a evaluar para estudiar la efectividad de los métodos de simplificación. Se experimentó con técnicas de simplificación de dos tipos: léxicas y sintácticas. Para realizar simplificación léxica, se identificaron palabras complejas con un clasificador SVM basado en vocabulario y se sustituyeron por palabras más simples con BERT-LS. BERT-LS toma en cuenta tanto el contexto del enunciado como la palabra compleja a la hora de generar candidatos para sustituir la palabra. Para realizar simplificación sintáctica, se aplicaron reglas para reducir la complejidad de los enunciados, que fueron previamente analizados sintácticamente. Finalmente, se considera que el trabajo realizado cumplió con los objetivos planteados al inicio del proyecto. Se logró implementar una herramienta para evaluar y simplificar textos que podrá facilitar el trabajo de la enseñanza de inglés en niños.