Utilisation du module ORI-OAI-harvester

Ouvrir un navigateur web et, suivant l'installation effectuée, aller à l'adresse du module.
Si le module a été installé selon la documentation proposée avec un Tomcat par module, cette adresse devrait ressembler à :

http://NOM_SERVEUR_ORI:8181/ori-oai-harvester

L'utilisation proposée est faite sur une application installée par défaut vide.


L'interface propose 5 onglets :

  1. Définitions correspond à la page d'accueil, elle permet de déclarer une nouvelle moisson et de gérer les moissons enregistrées
  2. Récoltes permet de visualiser les récoltes effectuées par le module
  3. Tâches programmées permet de visualiser les programmations définies pour chaque moisson
  4. Rapports permet de consulter les rapports des moissons effectuées
  5. Récupération permet de regénérer l'index
  6. A propos propose une description du module et des liens vers la documentation

Définitions

L'onglet "définitions" liste les moissons qui ont été définies, et permet de mener les actions suivantes :

Définir une nouvelle moisson

A partir de l'onglet « Définitions », cliquer sur pour ajouter la définition d'une nouvelle moisson.

1) Déclarer l'entrepôt que l'on souhaite moissonner

Pour cela, deux possibilités sont proposées :

Pour valider le choix effectué, cliquer sur le « + » situé à droite de la ligne choisie. Les informations de l'entrepôt choisi doivent alors s'afficher dans le formulaire.
Par exemple, en sélectionnant dans le menu déroulant l'entrepôt de thèses proposé par l'INPT, vous devriez obtenir l'affichage suivant :

Si les informations ne s'affichent pas correctement (le nom de l'entrepôt a comme valeur « not initialized » par exemple), c'est que l'entrepôt ne peut pas être moissonné (voir partie « Tester un entrepôt avant de le moissonner » au bas de cette page).
Il est aussi possible de déclarer une moisson multiple en ajoutant plusieurs entrepôts (voir plus bas).

2) Programmer les moissons dans l'entrepôt

Il existe deux façons de lancer une moisson : le lancement immédiat et le lancement par programmation. Le lancement immédiat s'opère à partir de l'onglet « Définitions », une fois la définition enregistrée, à l'aide du bouton vert « Lancer la moisson maintenant » (voir plus bas).
En plus de ce mode immédiat et manuel, l'utilisateur peut définir, pour une moisson, une ou plusieurs programmations, en précisant pour chacune d'elles une périodicité.
Pour cela, il faut utiliser la partie en haut à droite du formulaire.

Sélectionner la périodicité (tous les jours, toutes les semaines, …), puis détailler votre choix dans les champs proposés. Les informations remplies s'expriment en français au-dessus du formulaire. Pour valider le formulaire, cliquer sur « + Ajouter une programmation ». A la place du message « Aucune programmation », la programmation choisie s'affiche.

3) Définir les paramètres de moisson de l'entrepôt

Pour cela, il faut utiliser la partie en haut à gauche et la partie "Critères d'ensemble" du formulaire.
Remplir :

Sélectionner le type de sélection et l'ensemble choisi dans les listes déroulantes ;puis ajouter en cliquant sur

4) Valider cette définition de moisson

Une fois le formulaire complètement rempli, cliquez sur « enregistrer cette définition », vous retournez sur la page d'accueil, de définition des moissons.

Lancer une moisson manuellement

A partir de l'onglet « définitions », sur la ligne correspondant à la moisson que vous souhaitez lancer, cliquez sur le bouton (rond) vert pour lancer la moisson.

Modifier une définition de moisson

A partir de l'onglet « définitions », sur la ligne correspondant à la moisson à modifier, cliquer sur l'icône « écrire ».

Le formulaire de modification s'affiche. Les éléments de définition de la moisson autres que le ou les entrepôts moissonnés et l'identifiant initialement donné sont modifiables, ainsi que la programmation de la moisson.

Supprimer une définition de moisson

A partir de l'onglet « définitions », sur la ligne correspondant à la moisson à supprimer, cliquer sur l'icône « poubelle » pour supprimer la moisson.

Remarque : cela ne supprime pas les fiches déjà moissonnées sur les entrepôts définis dans cette moisson. Si vous souhaitez les supprimer il faut le faire également.

Définir une moisson multiple

Il est possible de définir plusieurs entrepôts à moissonner simultanément. Dans ce cas, les éléments de définition sont communs à l'ensemble des entrepôts choisis. Il n'est donc pas possible par exemple de choisir un set particulier ou un format de métadonnées que seul l'un des entrepôts propose.

Récoltes

L'onglet "Récoltes" permet de visualiser le nombre de documents qui ont été récoltés et qui sont stockés dans la base de données.

Consulter les récoltes

Cliquez sur l'onglet « Récoltes », la liste des moissons définies s'affiche, avec pour chacune la date de la dernière moisson effectuée et le nombre global de documents moissonnés.
Cliquer sur le bouton « Rafraîchir » pour mettre à jour les informations affichées.

Une moisson peut durer d'une à plusieurs minutes.
Pour les nouvelles moissons, appuyer sur rafraîchir à intervalle régulier. La moisson est terminée lorsque le compteur « Nombre de documents » ne s'incrémente plus et que la date du jour apparaît dans le champ « Dernière moisson ».
Pour visualiser l'affichage des fiches moissonnées, consulter le moteur de recherche.

Supprimer les fiches d'une moisson

A partir de l'onglet « Récoltes », sur la ligne correspondant à la moisson à supprimer, cliquer sur l'icône « poubelle » pour supprimer les fiches correspondant à cette définition de moisson.
Cette action peut-être utile dans le cas où on ne veut plus des fiches de cette définition, ou dans le cas où l'on veut recommencer une moisson depuis le début. Dans ce dernier cas, il faut supprimer la récolte, puis relancer la moisson.

Tâches programmées

Cliquer sur l'onglet « Tâches programmées », la liste des moissons programmées en cours s'affiche, avec pour chacune les renseignements suivants :

Rapports

Cet onglet permet de consulter les rapports concernant les moissons qui ont été exécutées.

Pour chaque définition, on peut voir simplement le dernier rapport (icône oeil de gauche), ou l'ensemble des rapports depuis la première moisson (icône oeil de droite).

Chaque définition de moisson possède, pour chaque occurence de moisson, une partie globale et une partie propre à chaque entrepôt défini pour cette moisson.

La partie globale contient les informations suivantes :

Ces compteurs sont donc eux-même subdivisés sur trois lignes :

Tout ces détails qui peuvent paraître superflus, sont fournis pour aider à diagnostiquer les eventuels problèmes et afin de bien visualiser les choses.

Récupération

En cas de problème (index corrompu,..), il est possible de réindexer les fiches moissonnées, depuis l'onglet "Récupération", partie Récupération.

Deux modes sont offerts.

Effectuer une veille sur les entrepôts à moissonner

Aujourd'hui, la vaste majorité des archives institutionnelles OAI concerne la production scientifique. En effet, le projet OAI (Open Archives Initiative : initiative des archives ouvertes) s'est initialement développé dans le champ de la recherche scientifique, afin de permettre l'échange de documents numérique au sein de la communauté des chercheurs.
C'est pourquoi, les répertoires qui existent en ligne proposent presque systématiquement des listes d'entrepôts relatifs à la production scientifique (thèses, documents scientifiques, publications,…).
Néanmoins, ces répertoires peuvent être un premier point de départ. On peut en citer quelques exemples, qui sont en anglais :

La veille sur les entrepôts de ressources pédagogiques se fera donc plutôt au cas par cas, en naviguant sur internet, à partir de mots-clés comme par exemple "entrepôt", "ressources pédagogiques", "OAI", "learning resource", "educational resource", "repository", etc.
Aller voir du côté des communautés francophones (Belgique, Canada, Suisse,…) peut aussi être une autre source de pistes.

Tester un entrepôt avant de définir une moisson

Pourquoi tester un entrepôt et son contenu avant de définir une moisson ?
D'une part, pour vérifier que l'URL OAI mène bien vers un entrepôt OAI et que l'entrepôt est encore actif. D'autre part, pour analyser le contenu au regard du public et des besoins de son institution.
Il existe sur internet un outil qui permet l'analyse d'archives institutionnelles respectant le protocole OAI-PMH. Cet outil, "Open Archives Initiative - Repository Explorer", se trouve à l'adresse suivante : http://re.cs.uct.ac.za//. Il est hébergé et maintenu par l'Université du Cap en Afrique du Sud.
L'analyse se fait en utilisant l'une des six requêtes de l'OAI-PMH (pour plus d'informations se reporter à : http://www.openarchives.org/OAI/openarchivesprotocol.html). Certes sommaire, l'outil permet par exemple de connaître les formats de métadonnées gérés dans l'entrepôt, de savoir si l'entrepôt contient des ensembles ("sets" en anglais), d'accéder à la liste des fiches de métadonnées de l'entrepôt ou d'un ensemble (si il en existe).