Antes de comenzar
¿Qué son los datos vinculados?
La principal diferencia entre la web de hipertexto y la web semántica es que mientras la primera se vincula en documentos o páginas html, la segunda requiere ir más allá del concepto de documentos y vincular datos estructurados. En este contexto, los datos vinculados son el conjunto de buenas prácticas para publicar y conectar datos estructurados en la web. Su principal objetivo es liberar datos de silos enmarcados por esquemas de bases de datos propietarias siguiendo cuatro reglas, definidas por Tim Berners-Lee en 2006:
- utilizar URI (identificadores de recursos uniformes) para identificar los recursos de manera exclusiva;
- utilizar URI de http de manera que las personas puedan acceder a información sobre el recurso;
- proporcionar información sobre los recursos utilizando formatos estándares como RDF/XML, y
- incluir enlaces a otros recursos, URI, lo que mejora el vínculo entre diferentes recursos distribuidos a través de la web.
Estos principios se definen como reglas, pero en realidad son más bien recomendaciones o mejores prácticas para el desarrollo de la web semántica. Es posible publicar datos que satisfagan sólo los primeros tres principios, pero no cumplir el cuarto reduce la visibilidad de los datos y por lo tanto, la posibilidad de reutilizarlos.
¿Qué es el RDF?
RDF es el Marco de Descripción de Recursos para metadatos en la web, desarrollado por W3C. Se basa en la idea de declarar recursos utilizando la expresión en la forma de sujeto-predicado-objeto. Esta expresión se conoce como triple RDF y contiene tres componentes, todos con su propio URI:
- Sujeto, un URI, una persona o un nodo; la identidad a la que nos referimos;
- Predicado: la propiedad o relación que se desea determinar sobre el sujeto;
- Objeto: el valor de la propiedad u otro recurso que establece la relación.
Utilizando URI para vincular datos, la web semántica se transforma en una especie de gran base de datos que permite a las personas y a las máquinas explorar la información referenciada e interconectada. La web basada en LOD es una innovación en la sindicación de contenido que utiliza fuentes de datos externas para crear nuevos servicios.
¿Qué son los datos de acceso abierto vinculados?
Los datos de acceso abierto vinculados (LOD) son datos vinculados distribuidos conforme a una licencia de acceso abierto que permite su reutilización gratuita. En 2010, Tim Berners-Lee definió un sistema de clasificación de 5 estrellas para incentivar a los proveedores de datos a distribuir datos en el marco de licencias abiertas. El esquema utiliza estrellas doradas para evaluar la disponibilidad de datos vinculados como datos de acceso abierto vinculados.
¿Cómo facilitar la vinculación entre recursos?
La mera transformación de esquemas de bases de datos en RDF no crea datos vinculados. Existe la posibilidad de quedarse atrapado en la cuarta estrella del sistema de clasificación de 5 estrellas. Debe ser posible crear vínculos automáticos entre almacenes triples RDF en la web; de lo contrario, existe el riesgo de crear silos RDF. La manera más directa de facilitar la creación de vínculos automáticos entre conjuntos de datos es mediante el uso de vocabularios estándar, incluyendo aquellos para describir elementos de datos/metadatos y para indicar valores.
Para entregar a los proveedores de datos un conjunto de recomendaciones que faciliten la selección de estrategias adecuadas de codificación para producir datos habilitados por LOD, el Equipo de AIMS preparará una serie de recomendaciones LODE que abarquen un amplio abanico de tipos de recursos, inclusive las estrategias de codificación para producir datos bibliográficos habilitados por LOD y la codificación de vocabularios de valor utilizados para describir agentes, lugares y temas en los datos bibliográficos.