harvesting

  • SemaGrow 网络搜索器:“网络爬虫+关键词提取器AgroTagger”

    此网络研讨会将介绍SemaGrow 网络搜索器:“网络爬虫+关键词提取器AgroTagger”,以收集关于SemaGrow 发展状态的反馈、想法和评论以及如何利用示范者帮助攻克数据问题。SemaGrow 是由欧洲委员会研究和技术发展第七框架项目(FP7)支持,旨在于发展算法,基础设施和方法学,以解决大数据量和实时性能。在此情境下,联合国粮农组织(FAO)提供一个组件,能用来抓取网络,使用Agro标签者赋予所发现的资源意义,使其可以为已经抓取的网页分配AGROVOC URIs地址。网络搜索器可在 https://github.com/agrisfao/agrotagger.公开获取。