Extracción de información de la Web basado en ontologías

Fernández Peirano, Alvaro

Supervisor(es): Motz, Regina

Resumen:

En este trabajo se presenta un proceso que permite automatizar la extracción de información de la Web. A este tipo de procesos se les denomina Wrappers. Un wrapper es un programa que se conecta con una fuente de información, extrae los datos relevantes en base a reglas predefinidas por el usuario y devuelve la información encontrada en un formato estructurado. El wrapper propuesto en este trabajo está guiado por consultas del usuario y basado en Ontologías. Una Ontología permite definir y trabajar un vocabulario común para referirse a los diferentes conceptos del dominio, es decir, asociarle un significado inequívoco a cada concepto.


Detalles Bibliográficos
2004
Ontologías
WRAPPERS
Extracción de información
WEB
Español
Universidad de la República
COLIBRI
http://hdl.handle.net/20.500.12008/2931
Acceso abierto
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)
Resumen:
Sumario:En este trabajo se presenta un proceso que permite automatizar la extracción de información de la Web. A este tipo de procesos se les denomina Wrappers. Un wrapper es un programa que se conecta con una fuente de información, extrae los datos relevantes en base a reglas predefinidas por el usuario y devuelve la información encontrada en un formato estructurado. El wrapper propuesto en este trabajo está guiado por consultas del usuario y basado en Ontologías. Una Ontología permite definir y trabajar un vocabulario común para referirse a los diferentes conceptos del dominio, es decir, asociarle un significado inequívoco a cada concepto.