BASE – 一个强大的开放获取搜索引擎

BASE搜索引擎(比勒费尔德学术搜索引擎),一个用于检索开放获取内容、自动分类的工具,自2004年以来一直有效,包含2900个主要的学术知识库中37,400,000条文档。特别是它的截词功能、检索历史、分类、挖掘功能以及与语言工具的配合。通过绑定BASE到不同的界面的可能性来保证互操作性。

当收割OAI-PMH(元数据收割开放文库计划协议)界面时,它受到整合搜索结果的挑战,如组合链接、对应的元数据和全文获取的单一来源。BASE计划并且尝试了对不同来源值的元数据质量进行标准化和增强化处理,如语言值、出版物类型,因为描述彼此各异,以此来更好聚合相似内容。

BASE使用有关来自诸如OpenDOAR(开放获取仓储检索系统)主题知识库和学科知识库注册表的信息。BASE的目标依然是通过自动分析内容信息、构建知识数据库来实现自动分类,以便于提供另外一个、基于主题的浏览方式。