Esquema de anotación de expresiones y marcas temporales. Proyecto TEMANTEX
Resumen:
Las expresiones temporales refieren a intervalos o duraciones en la línea del tiempo. Estas expresiones pueden formularse apelando a distintos tipos de unidades de las llamadas de calendario (partes del día, días, meses, años, siglos, etc.), que pueden referir de manera precisa o vaga, absoluta o relativa, o a unidades que siempre se presentan como vagas o genéricas. Se define un esquema de anotación que trata de capturar y categorizar toda la información que pueda resultar de ayuda para la tarea de aprendizaje automático de expresiones y relaciones temporales en un texto. Uno de los rasgos distintivos del esquema que se propone es la búsqueda de una representación lo más cercana posible al texto, excluyendo por lo tanto representaciones que implican cálculos de valores absolutos por parte del anotador (al estilo de TIDES O TIMEX3). Incluido en el esquema se presenta el lenguaje de descripción temporal LDT. En Anexo II se adjunta una selección de ejemplos discutidos durante el taler de anotación en el cual se experimentó con el esquema a los efectos de su validación.
2011 | |
Procesamiento de Lenguaje Natural Expresiones Temporales Anotación de Textos |
|
Universidad de la República | |
COLIBRI | |
http://hdl.handle.net/20.500.12008/3464 | |
Acceso abierto | |
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0) |
Sumario: | Las expresiones temporales refieren a intervalos o duraciones en la línea del tiempo. Estas expresiones pueden formularse apelando a distintos tipos de unidades de las llamadas de calendario (partes del día, días, meses, años, siglos, etc.), que pueden referir de manera precisa o vaga, absoluta o relativa, o a unidades que siempre se presentan como vagas o genéricas. Se define un esquema de anotación que trata de capturar y categorizar toda la información que pueda resultar de ayuda para la tarea de aprendizaje automático de expresiones y relaciones temporales en un texto. Uno de los rasgos distintivos del esquema que se propone es la búsqueda de una representación lo más cercana posible al texto, excluyendo por lo tanto representaciones que implican cálculos de valores absolutos por parte del anotador (al estilo de TIDES O TIMEX3). Incluido en el esquema se presenta el lenguaje de descripción temporal LDT. En Anexo II se adjunta una selección de ejemplos discutidos durante el taler de anotación en el cual se experimentó con el esquema a los efectos de su validación. |
---|