Esquema de anotación de expresiones y marcas temporales. Proyecto TEMANTEX

Wonsever, Dina - Malcuori, Marisa - Etcheverry, Mathías

Resumen:

Las expresiones temporales refieren a intervalos o duraciones en la línea del tiempo. Estas expresiones pueden formularse apelando a distintos tipos de unidades de las llamadas de calendario (partes del día, días, meses, años, siglos, etc.), que pueden referir de manera precisa o vaga, absoluta o relativa, o a unidades que siempre se presentan como vagas o genéricas. Se define un esquema de anotación que trata de capturar y categorizar toda la información que pueda resultar de ayuda para la tarea de aprendizaje automático de expresiones y relaciones temporales en un texto. Uno de los rasgos distintivos del esquema que se propone es la búsqueda de una representación lo más cercana posible al texto, excluyendo por lo tanto representaciones que implican cálculos de valores absolutos por parte del anotador (al estilo de TIDES O TIMEX3). Incluido en el esquema se presenta el lenguaje de descripción temporal LDT. En Anexo II se adjunta una selección de ejemplos discutidos durante el taler de anotación en el cual se experimentó con el esquema a los efectos de su validación.


Detalles Bibliográficos
2011
Procesamiento de Lenguaje Natural
Expresiones Temporales
Anotación de Textos
Universidad de la República
COLIBRI
http://hdl.handle.net/20.500.12008/3464
Acceso abierto
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)
Resumen:
Sumario:Las expresiones temporales refieren a intervalos o duraciones en la línea del tiempo. Estas expresiones pueden formularse apelando a distintos tipos de unidades de las llamadas de calendario (partes del día, días, meses, años, siglos, etc.), que pueden referir de manera precisa o vaga, absoluta o relativa, o a unidades que siempre se presentan como vagas o genéricas. Se define un esquema de anotación que trata de capturar y categorizar toda la información que pueda resultar de ayuda para la tarea de aprendizaje automático de expresiones y relaciones temporales en un texto. Uno de los rasgos distintivos del esquema que se propone es la búsqueda de una representación lo más cercana posible al texto, excluyendo por lo tanto representaciones que implican cálculos de valores absolutos por parte del anotador (al estilo de TIDES O TIMEX3). Incluido en el esquema se presenta el lenguaje de descripción temporal LDT. En Anexo II se adjunta una selección de ejemplos discutidos durante el taler de anotación en el cual se experimentó con el esquema a los efectos de su validación.