AgroTagger
Utilisé pour l’indexation des ressources d’information, Agrotagger est un extracteur de mots clés qui utilise le thésaurus AGROVOC comme ensemble de mots-clés admis. Il peut extraire à partir de documents, de fichiers PDF et de pages web.
Généralités
Agrotagger est au départ (2010) un projet mené en collaboration avec l’Institut indien de technologie de Kanpur (IITK). À partir du moteur d’extraction Keyword Extraction Engine (KEA) l’équipe a créé plusieurs versions, certaines sur la base d’un sous-ensemble réduit d’AGROVOC intitulé AGROTAGS (produit par le partenaire ICRISAT) et d’autres utilisant l’ensemble complet des concepts AGROVOC.
MIMOS, en collaboration avec l’IITK et la FAO, a créé une application intéressante en plus du service de taggage IITK: les mots-clés générés sont stockés sous forme de triplets RDF qui sont utilisés pour construire un nuage d’étiquettes montrant les mots-clés les plus couramment extraits.
La FAO a en outre collaboré avec le Centre de recherche sur les métadonnées de l’Université de Caroline du Nord qui incorpore AGROVOC à côté d’autres thésaurus dans HIVE, son outil d’indexation et de navigation.
Enfin, dans le cadre du projet agINFRA, la FAO a assemblé un programme d’indexation sur la base d’AGROVOC en utilisant le framework d’indexation Maui.
Services
Il existe actuellement plusieurs services qui peuvent être contactés soit comme interface web pour le chargement manuel de document ou comme services web REST qui peuvent être appelés par un processus de programmation:
AGROTAGS V3 sous-ensemble d’AGROVOC
Thésaurus AGROVOC complet
- Agrotagger de IITK Kanpur hébergé par MIMOS (pour appeler ce service par programmation, suivre les mêmes instructions que pour le service IITK Kanpur)
Université de Caroline du Nord – Indexeur Hive
- Service de téléchargement amont manuel contenant AGROVOC
- Comment appeler ce service par programmation en utilisant REST
Indexeur Maui contenant AGROVOC
Outils d’installation:
Évaluations
En 2011, le Centre de recherche sur les métadonnées de l’École des sciences de l’information et de la bibliothéconomie de l’Université de Caroline du Nord, a effectué deux analyses d’AgroTagger. Objectif: comparer l’indexation automatique et l’indexation manuelle.
“An Evaluation of Automatically Assigned Subject Metadata using AgroTagger and HIVE"
Un travail personnel de Jenni Clements.
L’étude compare les métadonnées sujets affectées par deux programmes d’indexation automatique, AgroTagger et HIVE (Helping Interdisciplinary Vocabulary Engineering), aux métadonnées sujet affectées par des professionnels de l’information. Son objectif est de déterminer si les termes générés automatiquement soutiennent la comparaison avec ceux affectés par des professionnels et s’ils peuvent être considérés comme suffisamment bons pour être utilisés dans des enregistrements de métadonnées.
Un rapport collectif de Jackie Chapman, Jesse Savage et Brian Young.
L’objectif du projet est d’étudier l’efficacité des termes de métadonnées AGROVOC générées automatiquement et manuellement, en évaluant la pertinence des termes en fonction de l’opinion de l’utilisateur. L’étude pilote cherche à établir une méthodologie permettant de réaliser l’objectif général du projet, y compris l’élaboration d’un outil d’enquête pouvant être utilisé à l’avenir dans des études à plus grande échelle.