关联数据
关联数据是网络出版的一种方式,意味着每一份数据都是:
· 有着独一无二的可识别的HTTP URIs(URLs或网络地址);
· 同时实现了”机器可读“数据和”人类可读“网页,并且与其它资源相关联
AGROVOC作为出版的关联数据集现在已可获取,与其它若干词汇表保持一致(关联)。AGROVOC 关联数据版本是RDF/SKOS-XL模型,并且保存在Allegrograph 三元存储中。机器读取的数据是通过SPARQL端点实现的,人类可读取的数据是通过Loddy生成的HTML网页实现的。数据由MIMOS Berhad公司托管(马来西亚),为联合国粮农组织研究合作伙伴。
表1 下表列出了与AGROVOC相关联的词汇表的一些特征:
资源 | 主题 | 关联概念总量 | 语种 | 关联资源是否可以作为关联开放数据? | 链接类型 (and # of 关联概念) | |
1 | 水科学和渔业文摘(ASFA) | 渔业 | 1784 | 是 | skos:closeMatch (38), skosLexactMatch (1741) | |
2 | 生物技术术语表(FAO) | 生物技术 | 793 | 英语、西班牙语、法语,3种以上 | 是 | skos:closeMatch (793) |
3 | 中文农业主题词表 (CAT) | 农业 | 是 | skos:narrowMatch (137) skos:broadMatch (10153) skos:exactMatch (10325) | ||
4 | DBpedia | 综合 | 11009 | 英语、西班牙语、法语,8种以上 | 是 | skos:closeMatch (11009) |
5 | 杜威十进分类法(DDC) | 综合 | 401 | 英语、西班牙语、法语,8种以上 | 是 | skos:closeMatch (2) skos:exactMatch (399) |
6 | 欧盟多语种主题词表 | 欧盟综合 | 1 269 | 英语、西班牙语、法语,21种以上 | 是 | skos:exactMatch (1269) |
7 | GEMET主题词表 | 环境 | 1 175 | 英语、西班牙语、法语,30种以上 | 是 | skos:exactMatch (1175) |
8 | GeoNames地理数据库 | 地理实体 | 206 | 英语、西班牙语、法语,63种以上 | 是 | skos:exactMatch (206) |
9 | 地理政治本体 | 地理政治实体 | 253 | 阿拉伯语、汉语、英语、西班牙语、法语、俄语 | 是 | skos:exactMatch (253) |
10 | 国会图书馆主题标引(LCSH) | 综合 | 1 075 | 英语 | 是 | skos:exactMatch (1075) |
11 | 国家农业图书馆主题词表 | 农业 | 13114 | E英语、西班牙语 | 是 | skos:exactMatch (13114) skos:closeMatch (2) |
12 | 统一字顺式和百科全书式规范目录 | 综合 | 670 | 法语 | 是 | skos:exactMatch (670) |
13 | STW - 经济学主题词表 | 经济 | 1125 | 英语、德语 | 是 | skos:exactMatch (1122) skos:closeMatch (3) |
14 | TheSoz - 社会科学主题词表 | 社会科学 | 827 | 英语、德语 | 是 | skos:exactMatch (821) skos:closeMatch (6) |
15 | 德语主题规范文档(SWD) | 综合 | 6 245 | 德语 | 是 | skos:exactMatch skos:closeMatch skos:broadMatch skos:narrowMatch |
16 | EARTh | 环境 | 1363 | 英语等 | 是 | skos:exactMatch (1363) |
表1. 与AGROVOC关联的词汇表的一些特征(2015年1月最后更新)
AGROVOC关联数据集的VoID描述也提供获取。
AGROVOC顶层概念
为了快速获取人类可读的关联数据,AGROVOC 网页使用以下顶层概念表(请注意:以下相同的 HTTP URIs可以转回到RDF,如果在HTTP标头作特别要求):
- 活动http://aims.fao.org/aos/agrovoc/c_330834
- 资源http://aims.fao.org/aos/agrovoc/c_9001017
- 实体http://aims.fao.org/aos/agrovoc/c_330892
- 地址http://aims.fao.org/aos/agrovoc/c_331000
- 事件http://aims.fao.org/aos/agrovoc/c_330979
- 阶段http://aims.fao.org/aos/agrovoc/c_330995
- 因素http://aims.fao.org/aos/agrovoc/c_331093
- 状态http://aims.fao.org/aos/agrovoc/c_330998
- 特征http://aims.fao.org/aos/agrovoc/c_331061
- 策略http://aims.fao.org/aos/agrovoc/c_330991
- 群组http://aims.fao.org/aos/agrovoc/c_50227
- 主题http://aims.fao.org/aos/agrovoc/c_330829
- 方位http://aims.fao.org/aos/agrovoc/c_330988
- 物质http://aims.fao.org/aos/agrovoc/c_4788
- 措施http://aims.fao.org/aos/agrovoc/c_330493
- 系统http://aims.fao.org/aos/agrovoc/c_330985
- 对象http://aims.fao.org/aos/agrovoc/c_330919
- 方法http://aims.fao.org/aos/agrovoc/c_4788
- 生物体http://aims.fao.org/aos/agrovoc/c_49904
- 技术http://aims.fao.org/aos/agrovoc/c_7644
- 现象http://aims.fao.org/aos/agrovoc/c_330704
- 产品http://aims.fao.org/aos/agrovoc/c_6211
- 程序http://aims.fao.org/aos/agrovoc/c_13586
- 时间http://aims.fao.org/aos/agrovoc/c_7778
- 属性http://aims.fao.org/aos/agrovoc/c_49874
SPARQL查询界面
使用SPARQL(SPARQL协议和RDF查询语言)也可以获取AGROVOC。SPARQL语言是类似SQL的查询语言可专门用来从三元组存储中提取RDF三元组:
SPARQL查询示例
以某个资源的URI为例,例如http://aims.fao.org/aos/agrovoc/c_4039去发现英语语种优选标签和所有精确匹配:
"Japan"@e <http://www.fao.org/countryprofiles/geoinfo/geopolitical/resource/Japan>
例如,给出“日本”的英文优选标签,发现URI和所有精确匹配: