1. Las recomendaciones LODE-BD

Con los avances de la Web hacia una era de datos vinculados, la aproximación tradicional de intercambio de datos entre silos pareciera llegar a su fin. Desde los gobiernos y las organizaciones internacionales hasta las ciudades y las instituciones locales, hay un amplio esfuerzo de abrir e interconectar sus datos. Este informe busca brindarle a los proveedores de datos bibliográficos, de repositorios con un conjunto de recomendaciones que ayudan con la selección de estrategias de codificación apropiadas para la producción Datos Abiertos Vinculados-datos bibliográficos habilitados [Linked Open Data (LOD)-enabled bibliographical data (LODE-BD)]

Datos vinculados, un término acuñado por Tim Berners-Lee en su nota de diseño [1] respecto a la arquitectura de la Web Semántica, se refiere a un conjunto de buenas prácticas para publicar, intercambiar e interconectar datos estructurados en la Web. Las tecnologías clave que construyen los Datos vinculados son: Identificadores Universales de Recursos (URIs, por su sigla en inglés) para la identificación de las entidades o conceptos en el mundo, el modelo RDF para la estructuración y vinculación de las descripciones de las cosas, HTTP para recuperar los recursos o las descripciones de los recursos  [2], y vínculos a otras URIs relacionadas en los datos expuestos para mejorar el descubrimiento y de información relacionada en la Web.

1.1. Propósito de las recomendaciones LODE-BD

En el universo bibliográfico hay un claro cambio de paradigma de los registros fijos a la declaración de metadatos recombinables. Para cualquiera que está contribuyendo con un repositorio de datos abiertos bibliográficos como proveedor de datos o proveedor de servicios, los procesos y estrategias de proporcionar datos como Datos vinculados son asuntos prácticos. Las Guías y recomendaciones sobre qué estándares seguir y cómo preparar metadatos listos para LOD son esenciales.

Parece no haber una aproximación que se ajuste a todos porque hay un gran número de estándares relacionados con metadatos desarrollados durante las dos últimas décadas. Estas han sido creadas por diferentes comunidades para propósitos específicos con el fin de guiar el diseño, creación e implementación de estructuras de datos, valores de datos, contenidos de datos e intercambio de datos en comunidades específicas. Los estándares de metadatos para estructuras de datos forman un amplio espectro, abarcando desde metadatos independientes (los cuales no reutilizan ningún término de metadatos desde un espacio de nombre conocido) a metadatos integrados (los cuales emplean e incorporan completa mente términos de metadatos existentes de otros espacios de nombre, normalmente vistos en nuevos perfiles de aplicación de metadatos desarrollados y en ontologías). Las decisiones respecto a qué estándar(es) adoptar, impactará directamente en el grado de legibilidad de LOD en los datos bibliográficos.

La aproximación de emplear conjuntos de elementos de metadatos bien aceptados y vocabularios valiosos ha mostrado ya grandes beneficios y potencialidades en términos de descubrimiento de recursos, reutilización de datos, intercambio de datos y la creación de nuevos contenidos basados en los Datos vinculados. Sin embargo, decidir tomar esta aproximación es únicamente el primer paso para los proveedores de datos y los proveedores de servicios de un repositorio bibliográfico abiertos. En el contexto de producir datos bibliográficos habilitados para LOD, los proveedores de datos y de servicios posiblemente tendrán muchas preguntas concretas relacionadas con las estrategias de codificación, por ejemplo:

  • ¿Qué estándar de metadato(s) debemos seguir con el fin de publicar cualquier dato bibliográfico como Dato vinculado?
  • ¿Cuál es el conjunto mínimo de propiedades que un conjunto de datos bibliográficos debería incluir para garantizar el intercambio entendible de datos?
  • ¿Existe algún modelo de metadatos o de perfil de aplicación que pueda ser adoptada directamente para la producción de datos bibliográficos (especialmente de nuestra base de datos local)?
  • Si el vocabulario contralado que usamos está disponible como Datos vinculados, ¿qué clase de valores deberíamos intercambiar a través de nuestros repositorios, específicamente, la forma literal de representación de un concepto o la URI que identifica el concepto?
  • ¿Cómo deberíamos codificar nuestros datos con el fin de movernos de una base de datos local a un conjunto de Datos vinculados?

Este informe nació en este contexto con el propósito de asistir a los proveedores de datos para la selección apropiada de estrategias de codificación para la producción de datos bibliográficos habilitados para LOD (directa o indirectamente). Las recomendaciones LODE-BD están construidas sobre cinco principios primordiales, con el fin de mejorar la calidad de la interoperabilidad y la efectividad del intercambio de información:

  1. Para promover la utilización de estándares de metadatos bien establecidos y los emergentes vocabularios habilitados para LOD propuestos en la comunidad de Datos vinculados;
  2. Para estimular la utilización de datos de autoridades, vocabularios controlados, y estándares de codificación de sintaxis en las declaraciones de metadatos, lo más pronto posible;
  3. Para estimular la utilización de URIs de recursos como valores de datos cuando están disponibles,
  4. Para facilitar el proceso de toma de decisiones respecto a la codificación de datos con el propósito de intercambio y reutilización;
  5. Para proporcionar un apoyo de referencia que esté abierto para sugerencias de nuevas propiedades y de términos de metadatos de acuerdo a las necesidades de la comunidad de Datos vinculados.

1.2 El informe de la hoja de ruta de LODE-BD

Las recomendaciones LODE-BD son presentadas como todo un paquete, que contiene los componentes importantes que un proveedor de datos puede encontrar cuando decide producir datos estructurados listos para LOD que se puedan compartir describiendo recursos bibliográficos (tales como artículos, monografías, tesis, ponencias, materiales de presentaciones, informes de investigación, objetos de aprendizaje, etc. – impresos o en formato electrónico) de una base de datos local. En el futuro, las recomendaciones pueden ampliarse para acomodarse a otros tipos de recursos de información.

Las recomendaciones están incluidas en la sección 2 y tres de este informe:

  • Sección 2, recomendaciones generales, presenta nueve grupos de propiedades comunes identificadas por LODE-BD y los términos de metadatos seleccionados para ser utilizados para la descripción de recursos bibliográficos.
  • Sección 3, árboles de decisiones, demuestra cómo tomar decisiones sobre la selección de las propiedades recomendadas de acuerdo a las necesidades locales.

Tabla 1. La hoja de ruta del informe LODE-BD


[1] Berners-Lee, Tim. 2007, Linked Data – Design Issues.   http://www.w3.org/DesignIssues/LinkedData Last accessed: June 2012

[2] LOD2 Collaborative Project. 2010. Deliverable 12.5.1. Project fact sheet version 1.  http://static.lod2.eu/Deliverables/LOD2_D12.5.1_Project_Fact_Sheet_Version.pdf  Last accessed: June 2012