РЕКОМЕНДАЦИИ ПО ПРАКТИЧЕСКОМУ ПРИМЕНЕНИЮ НАБОРА СВОЙСТВ МЕТАДАННЫХ И СЛОВАРЕЙ, ПОДДЕРЖИВАЮЩИХ КОДИРОВКИ

Рекомендации M2B предназначены для оказания информационной поддержки контент-провайдерам по выбору соответствующих свойств метаданных с целью создания, управления и обмена содержательной библиографической информацией в открытых хранилищах данных (репозиториях). Рекомендации M2B нацелены на:

  • обеспечение набора общих свойств метаданных;
  • поощрение использования авторитетных данных, контролируемых словарей и стандартов кодирования синтаксиса;
  • использование URI (если они доступны) в качестве унифицированных имён/идентификаторов для обозначения элементов (сущностей, значений данных разных типов) [1].

КОНЦЕПТУАЛЬНАЯ МОДЕЛЬ

Для того, чтобы иметь общую картину и общее понимание вовлечения логических объектов (категорий) и их отношений (связей) в библиографическое описание, M2B предлагает вниманию пользователей общую концептуальную модель [2] (Рисунок 1), обеспечивающую высокий уровень абстракции описания библиографического Ресурса. Основные связи могут быть определены между различными (видами) экземплярами Ресурса (например, статьёй или докладом) и:

  1. Агентом (ами) (например, отдельным автором или исследовательской группой),  которые ответственны за создание содержания и распространения ресурса, а также
  2. Темой (ами) (т.е. всем тем, что является предметом или темой статьи).

Таким образом, модель включает в себя три основных объекта:  Ресурс, АгентТема.

В основе модели, представленной на Рисунке 2, лежит импликация общей концептуальной модели, вместе с примерами возможных отношений/связей между и среди экземпляров различных объектов (сущностей).

Представленные модели передают следующие значения (имена сущностей представлены  курсивом):

1.) Основные объекты (сущности) и их отношения/связи.  

Сущность  Ресурс является исходной точкой каждого представленного здесь описания. Модель не иллюстрирует типы суб-сущностей, например, суб-сущностями ресурса могут быть различные типы ресурса. Отношения/связи установлены между сущностью Ресурс и двумя другими основными сущностями: Агент и Тема.

2.) Отношения между экземплярами в пределах одной сущности.  

Также существуют отношения/связи между экземплярами сущности. Например, определённый Ресурс  может быть связан с другим  Ресурсом.  Агент  может быть связан с другим Агентом. Эти отношения/связи представлены в модели. 

3.) Отношения между экземплярами разных сущностей. 

Отношения/связи между парами экземпляров варьируются и могут быть найдены на различных уровнях. Типовые образцы отношений/связей, которые представлены на  Рисунке 2, являются демонстративными и могут применяться на разных уровнях сущности  Библиографический ресурс. Например,  Агент может профинансировать создание оригинального произведения, его перевод или же создание нового формата перевода.

Контроль значений.  

Авторитетный контроль считается важным элементом модели. Названия  Агентов, независимо от их ролей по отношению к ресурсу, должны иметь ссылки на авторитетные файлы.  Концепты (понятия), темы и географические места - как составляющие предметного содержания Ресурса  - должны быть поддержаны значениями из соответствующих контролируемых словарей.  Несмотря на то, что модель не акцентирует внимание на авторитетном контроле названий библиографического Ресурса (учитывая контекст этого документа), авторитетный контроль унифицированных заглавий ресурса является логичным шагом. Все больше и больше авторитетных файлов, контролируемых словарей и наборов данных становятся доступными в формате Связанных Открытых Данных (Linked Open Data, LOD).

На нижеприведённых рисунках, возле каждой сущности (Ресурс, Агент, Тема) изображена часть облака LOD, в качестве напоминания пользователю о существующих контролируемых словарях и наборах данных в формате LOD.  

Представленная концептуальная модель:

  • играет ключевую роль в достижении общего понимания основных сущностей и связей в контексте библиографических данных;
  • может быть адаптирована (также посредством различных подходов к имплементации) для любой модели данных.

 

Общая концептуальная модель LODE-BD

Рисунок 1. Общая концептуальная модель LODE-BD

    Импликация общей концептуальной<br />
модели в случае LODE-BD  1.1

Рисунок 2. Импликация общей концептуальной
модели в случае LODE-BD 1.1

ГРУППЫ ОБЩИХ СВОЙСТВ

Общие свойства для описания библиографических ресурсов определены и обоснованы в разрезе девяти групп, разработанных на основе комплексного анализа  нескольких открытых хранилищ данных (репозиториев). Около двух десятков свойств, используемых для описания библиографического ресурса, включены в группы 1 - 8.

Два набора свойств, применяемых для описания отношений/связей между библиографическими Ресурсами или между Агентами, включены в группу 9. В нижеприведённом списке, некоторые атрибуты (свойства, элементы, сведения) выделены курсивом. В настоящем документе слово Ресурс используется для представления библиографического ресурса  или основного объекта описания.

1. Title Information. Заглавие (название, область заглавия). Этот элемент является одной из наиболее важных точек доступа к любому информационному ресурсу. Первоначальная информация о ресурсе передаётся через ряд его свойств, таких как Заглавие, Альтернативное (параллельное, переведённое заглавие, транслитерация заглавия) заглавие и т.д.;

2. Responsible Body. Ответственный орган (область сведений об ответственности). Эта группа включает в себя сведения о любом агенте, ответственном за создание и / или публикацию содержания ресурса, например: составитель, издатель, редактор, переводчик, автор-организация и другие лица, участвующие в создании и подготовке ресурса;

3. Physical Characteristics. Физические характеристики (физическое представление ресурса /область физических характеристик). Свойства этой группы (дата, идентификатор, язык, формат и издание / версия) содержат сведения о специфическом обозначении ресурса в сочетании с характеристиками его физической формы;

4. Location (physical location). Местоположение (физическое месторасположение/область местонахождения) ресурса. Для получения доступа к ресурсу и обмена информацией необходимо, чтобы ресурс был соответственно локализован. Эта группа содержит сведения, уточняющие местоположение и информацию о режиме доступа к ресурсу;

5. Subject. Тематика (предметная область/ тематическая классификация). В отличие от группы «Физические характеристики», эта группа включает в себя атрибуты, описывающие или позволяющие выявить (через предметные термины, классификацию / категорию, произвольное ключевое слово и географический термин) темы/ предметы, которые охватывает объект описания;

6. Description of content. Общее описание. Два основных вида описания, которые позволяют получить представление о содержании ресурса: (а) репрезентативное описание содержания, обычно в виде аннотации, резюме, примечания, оглавления; (б) вид или жанр ресурса;

7. Intellectual property. Информация об интеллектуальной собственности/авторских правах. Любой аспект, связанный с правами на интеллектуальную собственность. Эта группа уделяет особое внимание правам и условиям использования и обеспечения доступа к ресурсу;

8. Usage. Использование ресурса. Свойства, связанные с использованием ресурса. Типичные свойства этой группы: целевая аудитория, методические указания и рекомендации, уровень образования;

9. Relation. Связь. В этой группе представлены разные связи / отношения, существующие между двумя ресурсами (описываемым ресурсом и другим ресурсом) или между двумя агентами. Из-за значительного числа возможных связей, в ниже представленной таблице, раздел группы «Связь» не предусматривает перечень каких-либо конкретных/специфических связей.  

В нижеприведённой таблице (Таблица 1) представлен перечень вышеуказанных групп с указанием специфических свойств, включённых в каждую группу. Особое внимание должно быть уделено дополнительным рекомендациям по кардинальности, контролю значений и основным атрибутам.   

Таблица 1 включает следующие компоненты в соответствующих графах:

A. Группы свойств.

B. Свойства, включенные в каждую группу. Для обозначения важности свойств используются два специальных графических стиля: два знака плюс “++” (также в  красном цвете) для обозначения обязательного свойства; один плюс “+” (также в голубом цвете) для обозначения свойства, использование которое настоятельно рекомендуется в контексте обмена библиографической информацией. Остальные свойства являются рекомендуемыми или дополнительными (факультативными).

C. В контексте неаналитических и аналитических библиографических описаний, требования к свойствам указаны следующим образом: Обязательное (M); Высоко-Рекомендуемое (H-R); Рекомендуемое (R); Факультативное (O) для любого процесса.

D. Рекомендации по контролю значений, с указанием:

  • неконтролируемого значения;
  • соответствующего авторитетного или контролируемого словаря для представления значения;
  • определённых правил кодирования синтаксиса для представленного значения.

E. Некоторые важные атрибуты/параметры (с уделением особого внимание языку и схеме атрибутов/параметров), ассоциированные с индивидуальными свойствами. Схема может может представлять собой либо схему кодирования значений либо схему кодирования синтаксиса.

Таблица 1. Группы общих свойств

A B C D E
Группа Свойство Условие, обязательное для выполнения
| M | HR | R | O |
Контроль значения Основные атрибуты 
Неаналитический Аналитический
1. Title Information title++

 

M M n language
alternative title
 
O O n
2. Responsible Body creator+  HR HR n or Name authority (personal, corporate body, conference)
 
scheme
contributor O O n or Name authority
 
publisher/issuer+ HR R n or Name authority
 
3. Physical Characteristics
 
date++ M M Syntax encoding rule
 
scheme
identifier+ HR HR Syntax encoding rule
 
scheme
language++ M M Controlled list
 
scheme
format/medium+ HR HR Controlled list
 
scheme
edition /version R R n
 
 
source+ HR R n
 
 
4. Location  location++
 
M
 
M n or Rule
[Holding unit names may be  managed through a controlled list]
 
 
5. Subject subject term+ HR HR Controlled vocabulary language
scheme
 
classification O O Controlled vocabulary, Classification system
 
scheme
[freely assigned] keyword
 
R R n language
geographic term O O Controlled vocabulary language
scheme
 
6. Description of content description/abstract (or note/ summary/ table of contents)
 
R R n language
type/form/genre
 
R R Controlled vocabulary language
scheme
7. Intellectual property rights+
term of use
access condition
 
R R n [Rights holders may be managed through name authorities]  
8. Usage audience
 
O O Controlled list scheme
literary indication
 
O O Controlled list scheme
education level
 
O O Controlled list scheme
9. Relation [relation between resources]+
 
O HR Controlled resource IDs  
[relation between agents]
 
O O n or Name authority  

[1] See Lee, T-B.  (2006). Linked Data - Design Issues.

[2] The conceptual model is built on a FRBR-based model previously developed by the FAO AIMS team, with enormous extension and reconsideration for the current recommendations.

СВЯЖИТЕСЬ С НАМИ

Если Вы заинтересованы в получении дополнительной информации о M2B и LODE-BD, свяжитесь с нами по электронному адресу: AIMS@fao.org

КАК ЦИТИРОВАТЬ

Subirats, Imma; Zeng, Marcia L. (2012). Meaningful Bibliographic Metadata (M2B). Rome: Food and Agriculture Organization of United Nations.