Recommendations 2.0 LODE-BD

Avec le progrès du Web vers une ère de données ouvertes et liées, l'approche traditionnelle du partage des données au sein de silos semble atteindre sa fin. Des gouvernements, des organisations internationales, des villes et des institutions locales font un effort généralisé de l'ouverture et l'articulation de leurs données. Ce rapport vise à procurer aux fournisseurs de données bibliographiques des dépôts ouverts avec un ensemble de recommandations qui appuieront le choix des stratégies de codage appropriées pour la production de données ouvertes liées(LOD) - données bibliographiques permises(LODE-BD). Données liées, un terme inventé par Tim Berners-Lee dans sa conception [1] en ce qui concerne l'architecture du Web sémantique, réfère à un ensemble de meilleures pratiques pour l'édition, le partage et l'interconnexion des données structurées sur le Web. Les technologies clées sur lesquelles reposent les données liées sont: Uniform Resource Identifiers (URI) pour identifier les entités ou des concepts dans le monde, le modèle RDF pour structurer et reliant les descriptions de choses, HTTP pour récupérer des ressources ou des descriptions de ressources [2], et des liens vers d'autres URI connexes dans les données exposées pour améliorer la découverte de l'information connexe sur le Web.data (LODE-BD)]

1.1. Objectifs des recommendations LODE-BD 

Dans l'univers bibliographique, il ya un changement de paradigme clair à partir du passage des enregistrements fixes  aux métadonnées re-combinables. Pour toute personne qui contribue à un référentiel de données bibliographiques ouvertes en tant que fournisseur de services ou de données, les processus et les stratégies de fourniture de données liées sont des questions pratiques. Les lignes directrices et les recommandations sur les normes à suivre et comment préparer LOD métadonnées sont essentielles. Il n'y a pas d'approche unique, car il existait un grand nombre de normes concernant les métadonnées développées au cours des deux dernières décennies. Ils ont été créés par les différentes communautés pour guider la conception, la création et la mise en œuvre de structures de données, les valeurs, le contenu, et les échanges de données dans certaines communautés. Les normes de métadonnées opérationnelles de structures de données forment un large spectre, allant de ceux qui sont  indépendantes (qui ne  réutilisent pas les termes de métadonnées à partir d'un espace de noms connus) à ceux intégrées ( entièrement employant et incorporant les termes de métadonnées existantes provenant d'autres espaces de noms, généralement vu dans les nouveaux profils d'application de métadonnées développées et ontologies). Les décisions relatives à quel standard (s) adopter influera directement le degré de disponibilité-LOD des données bibliographiques. L'approche d'employer des ensembles d'éléments de métadonnées et des vocabulaires de valeur a déjà montré de grands avantages et des potentialités en termes de découverte de ressources, la réutilisation des données, partage de données, et la création de nouveau contenu sur la base de données liées. Cependant, décider de prendre cette approche n'est que la première étape pour les fournisseurs de données et les fournisseurs de services d'un référentiel de données bibliographiques ouvertes. Dans le contexte de la production de données bibliographiques permises LOD, les fournisseurs de données et de services sont susceptibles d'avoir de nombreuses questions spécifiques liées aux stratégies de codage, par exemple:

Quel standard (s) de métadonnées faut-il suivre pour publier les données bibliographiques en tant que données liées?

Quel est l'ensemble minimal de propriétés qu'un jeu de données bibliographiques devrait inclure pour assurer le partage des données significatives?

Yat-il un modèle de métadonnées ou de profil d'application qui peuvent être directement adopté pour produire des données bibliographiques (en particulier à partir de notre base de données locale)?

Si le vocabulaire contrôlé que nous avons utilisé est disponible en tant que données liées, quel type de valeurs devrions nous échangeons grâce à notre référentiel, en particulier, la forme littérale représentant un concept ou l'URI identifiant le concept?

Comment devrions-nous coder nos données afin de passer d'une base de données locale à un ensemble de données liées?

Ce rapport est né dans ce contexte dans le but d'aider les fournisseurs de données dans le choix des stratégies de codage approprié pour produire des données bibliographiques permises-LOD(directement ou indirectement). Afin d'améliorer la qualité de l'interopérabilité et l'efficacité de l'échange d'informations, les recommandations LODE-BD sont construits sur cinq clés principales:

Afin de promouvoir l'utilisation de normes de métadonnées bien établies et les vocabulaires de LOD activé proposés dans la communauté de données liées;

Pour encourager l'utilisation des données d'autorité, les vocabulaires contrôlés, et les normes de codage de syntaxe dans les métadonnées chaque fois que possible;

Pour encourager l'utilisation des URI de ressources et les valeurs de données quand ils sont disponibles;

Pour faciliter le processus de prise de décision en ce qui concerne le codage de données dans le but d'échange et de réutilisation;

Pour fournir un support de référence qui est ouvert aux suggestions de nouvelles propriétés et les termes de métadonnées selon les besoins de la communauté de données liées

1.2 La feuille de route LODE-BD

Les Recommandations LODE-BD sont présentées comme un tout, englobant les éléments importants qu'un fournisseur de données peut rencontrer au moment de décider de produire des données partageables LOD-prêts structurés décrivant les ressources bibliographiques (telles que des articles, des monographies, des thèses, documents de conférence, matériel de présentation, rapports de recherches, objets, etc. apprentissage - en format imprimé ou électronique) à partir d'une base de données locale. Dans l'avenir, les recommandations peuvent être étendues à accueillir d'autres types de ressources d'information.

Les recommandations sont incluses dans l'article 2 et 3 du présent rapport:

 Section 2, les recommandations générales, présente neuf groupes de propriétés communes identifiés par LODE-BD et les termes de métadonnées sélectionnés pour être utilisés pour décrire les ressources bibliographiques.

 Section 3, arbres de décision, montre comment prendre des décisions sur la sélection des propriétés recommandées en fonction des besoins locaux.

Table 1. La feuille de route de LODE-BD 

 

 


[1] Berners-Lee, Tim. 2007, Linked Data – Design Issues.   http://www.w3.org/DesignIssues/LinkedData Last accessed: June 2012

[2] LOD2 Collaborative Project. 2010. Deliverable 12.5.1. Project fact sheet version 1.  http://static.lod2.eu/Deliverables/LOD2_D12.5.1_Project_Fact_Sheet_Version.pdf  Last accessed: June 2012