Un algoritmo para la extracción de rasgos morfológicos a partir de descriptores
Resumen:
En este trabajo se propone un algoritmo para la alimentación de un diccionario español a partir de un conjunto de términos para la indización de documentos (descriptores) organizados en un tesauro. Se establecen e implementan heurísticas basadas en la estructura sintáctica de los descriptores y en la forma de las palabras que permiten deducir los siguientes rasgos morfológicos: categoría gramatical (sustantivo, adjetivo), número, género y formas flexionadas. Se utilizan como fuente de datos un tesauro y un diccionario de palabras "vacías" (conjunto base) tales como preposiciones, artículos, etc.
1996 | |
MORFOLOGIA TESAURO DESCRIPTOR PROCESAMIENT0 DE LENGUAJE NATURAL NATURAL LANGUAGE |
|
Español | |
Universidad de la República | |
COLIBRI | |
http://hdl.handle.net/20.500.12008/3491 | |
Acceso abierto | |
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0) |
Sumario: | En este trabajo se propone un algoritmo para la alimentación de un diccionario español a partir de un conjunto de términos para la indización de documentos (descriptores) organizados en un tesauro. Se establecen e implementan heurísticas basadas en la estructura sintáctica de los descriptores y en la forma de las palabras que permiten deducir los siguientes rasgos morfológicos: categoría gramatical (sustantivo, adjetivo), número, género y formas flexionadas. Se utilizan como fuente de datos un tesauro y un diccionario de palabras "vacías" (conjunto base) tales como preposiciones, artículos, etc. |
---|