Técnicas del estado finito para la extracción automática de metadata en la Web

Porteiro, Marcia - Paiva, Rodolfo

Supervisor(es): Motz, Regina - Moncecchi, Guillermo

Resumen:

El presente proyecto titulado "Técnicas de estado finito para la extracción de metadata en la Web" se enmarca dentro de la asignatura Proyecto de Grado del Instituto de Computación de la Facultad de Ingeniería. El mismo tiene una estrecha vinculación con dos de las áreas de mayor interés en lo que a computación respecta: el Ýrea de Concepción en Sistemas de Información y el Ýrea de Procesamiento de Lenguaje Natural. El proyecto consistió principalmente en el estudio de los factores involucrados en la extracción automática de la metadata asociada a una página Web dada, utilizando herramientas de estado finito, tales como transductores, para este fin. El análisis se materializa con el desarrollo incremental de un prototipo, que refleja las principales características detectadas en pro de realizar un procesamiento eficaz de la información. El crecimiento del uso de metadatas brindará un amplio espectro de posibilidades a los usuarios a la hora de ubicar y entender las principales características de los datos. A pesar de los beneficios de su utilización, actualmente los documentos localizados en la Web no se encuentran enriquecidos por lo general con esta información, lo que hace más difícil la tarea de manipulación y mantenimiento del vasto flujo de información que representan. Si bien la idea de generar automáticamente la metadata asociada a documentos presentes en un ambiente Web no es nueva, los enfoques propuestos se ven limitados debido a la inherente vinculación que ofrecen con la estructura de los documentos. La propuesta del uso de ontologías combinadas con máquinas de estado finito presenta una nueva visión para la generación. Este informe pretende delinear los rasgos más sobresalientes relevados a lo largo de la duración del proyecto, incluyendo los principales problemas encontrados a la hora de desarrollar un sistema de estas características, evaluando en cada caso las posibles soluciones.


Detalles Bibliográficos
2004
WEB SEMANTICA
METADATOS
EXTRACCION AUTOMATICA DE METADATOS
Español
Universidad de la República
COLIBRI
http://hdl.handle.net/20.500.12008/3068
Acceso abierto
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)