让我们开始吧
链接数据是什么?
超文本万维网和语义万维网的主要区别在于,前者链接html网页或者文件,而后者要求超越概念文件并链接有结构的数据。在这样的背景下,链接数据是出版和在万维网上链接有结构的数据的一套最佳措施。其主要目的是将数据从隐藏的数据库中解放出来,而这些数据库是按照Tim Berners-Lee于2006年界定的四项规则,用具有产权的数据库方案而建立。
- 应用URI(统一资源主字码)作为确定资源的唯一方式;
- 应用http URI,这样人们可以获得有关资源的信息;
- 应用诸如RDF/XML等标准格式,提供有关资源的信息;以及
- 包括与其它资源和URI的链接,增强万维网上分散的不同资源之间的链接。
这些原则被界定为规则,但是在现实中,应该是发展语义万维网的建议或者最佳措施。你可以发布仅仅符合前三项原则的数据,但是不实施第四项原则,将导致数据的可视度下降,这样其再用性就低。
什么是RDF?
RDF是由W3C开发的万维网元数据资源描述框架。这是基于应用主谓宾形式表达披露资源的设想。这种表达被称之为RDF三重结构数据。一个RDF三重结构数据包括三个组成分,各成分均有自身的URI:
- 主语,URI、一个人,或者结点是我们所指的实体;
- 谓语是你要设定的主语的属性或者关系;
- 宾语是属性的值或者建立关系的另外一个资源。
通过应用URI链接数据,语义万维网成为一种很大的数据库,允许人和机器探索参考和互联的信息。基于万维网的LOD是内容同时发表的一个突破,它应用外部数据源,生成新的服务。
什么是链接开放式数据?
链接开放式数据(LOD)是在开放式许可证制度下散发的链接数据,开放式许可证制度允许免费再次利用数据。2010年,Tim Berners-Lee界定了5星步骤方案鼓励数据提供者在开放式许可制度下提供链接数据。方案利用金星评估链接数据作为链接开放式数据的可用性。
如何促进资源之间的链接?
简单地将数据库的格转换成RDF并不能生成链接数据。在5星步骤方案的第4星阶段,可能卡壳。在万维网上的RDF三重结构数据库之间生成自动链接是可能的,否则可能会有生成RDF隐藏数据库的风险。促进数据集之间建立自动链接的最早期的方法是应用标准的词汇表,包括描述数据/元数据要素的标准词汇表,以及指示值的标准词汇表。
为了向内容提供者提供一套建议,支持为生成LOD-开启数据选择恰当的编码战略,AIMS团队计划编制一系列的LODE建议,交叠涵盖一系列的资源类型,包括生成LOD-开启书目数据的编码策略,以及描述书目数据的机构、位置和题目所用值词汇表的编码。