Uso de datos enlazados para la publicación e integración de datos de índole académico

Scalone, Marco

Supervisor(es): Motz, Regina

Resumen:

Hoy en día existe una gran cantidad de fuentes de información bibliográfica y de repositorios institucionales abiertos en línea. Estas fuentes, independientes, heterogéneas y distribuidas, suelen representar sus datos de diferente forma y brindar acceso a través de distintos mecanismos o protocolos. Además existe el grave problema de que no es costumbre identificar de forma unívoca a los autores de las publicaciones, a pesar que esto se ha comenzado a solucionar por el uso de ORCID, su utilización no es aún extendida fuera de los ámbitos de algunos servicios de publicación y no es para nada utilizado todavía en los ámbitos educativos. El mayor problema ocurre al integrar datos de fuentes de publicaciones científicas con fuentes como páginas web personales o institucionales o espacios de creaciones de materiales donde acostumbran trabajar los docentes-investigadores. Es en este escenario de docentes-investigadores que este trabajo estudia el ciclo de vida de la publicación de Linked Data (Datos Enlazados) como una forma de resolver el problema de integración de datos de publicaciones científicas. Este trabajo presenta un análisis de los conceptos de la web semántica aplicados a la publicación de Datos Enlazados y una revisión de las metodologías, recomendaciones y buenas prácticas existentes para la publicación de Datos Enlazados en la web. Estas guías y recomendaciones son utilizadas como base para el análisis de dos casos de estudio que se presentan, ambos de características diferentes, como lo son los libros de texto creados en la plataforma CNX.org, y la publicación, integración y análisis de las publicaciones científicas producidas por los docentes del Instituto de Computación de la Facultad de Ingeniería (UdelaR). En este último caso se publicaron como Datos Enlazados la lista de docentes publicada en el sitio web de la institución y las bases bibliográficas disponibles en el sitio web de FIng y en DBLP. Se diseñaron y ejecutaron procesos de detección de enlaces y resolución de identidad entre las tres fuentes y se presenta a la vez un estudio analítico a partir del uso de los Datos Enlazados.


Detalles Bibliográficos
2018
Datos enlazados
Web semántica
Integración de datos
Resolución de identidad
Bibliometría
Español
Universidad de la República
COLIBRI
https://hdl.handle.net/20.500.12008/20939
Acceso abierto
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC - By-NC-ND)
Resumen:
Sumario:Hoy en día existe una gran cantidad de fuentes de información bibliográfica y de repositorios institucionales abiertos en línea. Estas fuentes, independientes, heterogéneas y distribuidas, suelen representar sus datos de diferente forma y brindar acceso a través de distintos mecanismos o protocolos. Además existe el grave problema de que no es costumbre identificar de forma unívoca a los autores de las publicaciones, a pesar que esto se ha comenzado a solucionar por el uso de ORCID, su utilización no es aún extendida fuera de los ámbitos de algunos servicios de publicación y no es para nada utilizado todavía en los ámbitos educativos. El mayor problema ocurre al integrar datos de fuentes de publicaciones científicas con fuentes como páginas web personales o institucionales o espacios de creaciones de materiales donde acostumbran trabajar los docentes-investigadores. Es en este escenario de docentes-investigadores que este trabajo estudia el ciclo de vida de la publicación de Linked Data (Datos Enlazados) como una forma de resolver el problema de integración de datos de publicaciones científicas. Este trabajo presenta un análisis de los conceptos de la web semántica aplicados a la publicación de Datos Enlazados y una revisión de las metodologías, recomendaciones y buenas prácticas existentes para la publicación de Datos Enlazados en la web. Estas guías y recomendaciones son utilizadas como base para el análisis de dos casos de estudio que se presentan, ambos de características diferentes, como lo son los libros de texto creados en la plataforma CNX.org, y la publicación, integración y análisis de las publicaciones científicas producidas por los docentes del Instituto de Computación de la Facultad de Ingeniería (UdelaR). En este último caso se publicaron como Datos Enlazados la lista de docentes publicada en el sitio web de la institución y las bases bibliográficas disponibles en el sitio web de FIng y en DBLP. Se diseñaron y ejecutaron procesos de detección de enlaces y resolución de identidad entre las tres fuentes y se presenta a la vez un estudio analítico a partir del uso de los Datos Enlazados.