Implémentation FileSystem

You are viewing an old version of this page. View the current version.

Compare with Current View Page History

Version 1 Current »

Implémentation FileSystem - Mise en place rapide d'un entrepôt OAI-PMH "standalone"

Dans un certain nombre de cas d'utilisation, rendre moissonnable un ensemble de fiches simplement en les mettant dans un répertoire donné est intéressant.

Parmi ces cas d'utilisation, on retiendra notamment le cas d'un système de référencement/indexation pré-existant que l'on souhaiterait rendre rapidement moissonnable.

Utilisé seul (mode standalone), ori-oai-repository permet de rendre moissonnable un répertoire contenant des fiches de métadonnées (LOM par exemple) ... Ce répertoire joue alors le rôle d'un entrepôt OAI-PMH.

L'installation et la configuration de ce seul module sont alors rapides !

Rendre moissonnable un système pré-existant

On notera que quelque soit la solution envisagée, être capable de générer depuis ce système pré-existant des fiches XML dans le format souhaité (format manipulé usuellement par les entrepôts OAI-PMH) est une nécessité. Cela passe par l'élaboration d'une "moulinette" permettant l'export des informations en format XML d'un schéma donné.
Dans le cas d'un entrepôt OAI-PMH dédié aux ressources pédagogiques, le schéma sera le LOM (LOMFR / SupLOMFR).

  • Une fois que l'on sait faire cela, on peut alors envisager de rendre moissonnable son système en ajoutant les fonctionnalités "entrepôt OAI-PMH" directement dans l'applicatif, cela en redéveloppant toute la couche logicielle adéquate. On peut utiliser des bibliothèques adapatés déjà développés et disponibles dans le langage de son applicatif, celles-ci contenant tout l'aspect métier d'OAI-PMH. il existe de telles bibliothèques dans la plupart des langages et donc pour la plupart des "plateformes web" (php, python/zope, perl ... et bien sûr Java/J2EE) .
    On obtient alors une intégration dite forte de la couche logicielle OAI-PMH dans son applicatif.
  • On peut aussi, et au moins dans une première étape, se constituer rapidement un entrepôt OAI-PMH en mettant en place un outil spécialisé permettant de rendre accessible via OAI-PMH l'ensemble de fichiers XML prédisposés dans un répertoire donné. Ces fiches seront régulièrement mis à jour simplement via une moulinette (telle que décrite plus haut) :
    le mieux ici est que la moulinette puisse tourner régulièrement et mettre à jour ou ajouter si nécessaire les fiches XML dans le répertoire indiqué.

ori-oai-repository - fonctionnement en configuration FileSystem

Dans sa configuration FileSystem, ori-oai-repository fonctionne seul : aucun des autres modules ORI-OAI n'est nécessaire, il permet de rendre accessible rapidement via OAI-PMH un ensemble de fichiers XML (LOM par exemple) stockés dans un dossier de son ordinateur, de son serveur.

Voici ses caractéristiques :

  • il se base sur la date de modification du système de fichiers ; il est donc préférable (mais cependant pas obligatoire) de modifier/remplacer un fichier seulement si nécessaire,
  • il permet de répondre au protocole OAI-PMH sans le support des suppressions de fiches (comportement autorisé par le protocole OAI-PMH),
  • il permet d'utiliser les Sets OAI-PMH (comportement autorisé par le protocole OAI-PMH), en reproduisant l'arborescence des répertoires
  • il ne permet pas d'utiliser les fonctions de filtrage qui sont liées à l'indexation
  • il utilise les fonctionnalités usuelles apportées par ORI-OAI, notamment :
    • une configuration aisée des paramètres importants dans la mise en place d'un entrepôt OAI-PMH,
    • la conversion des fiches en OAI_DC via des XSL adapatés.
      => dans le cas de fiches LOM, disposer uniquement les fiches LOM dans un dossier permet aussi de répondre en OAI_DC

installation et mise en place

installation / configuration usuelle

On suivra au mieux la documentation fournie ici.

On notera que certaines fonctionnalités basées sur l'indexation des données ne sont actuellement pas disponibles. Il s'agit principalement du filtrage et des Sets depuis les classifications. De plus, en choisissant ce mode Filesystem, on doit valuer la propriété Identify.deletedRecord=no, car ce système ne permet pas de garder trace des fichiers supprimés.

Il faudra donc être attentif aux paragraphes donnés dans Configuration et installation de l'entrepôt OAI :

  • Installation
  • Fichiers de propriétés

Sets et arborescence des répertoires

Le DirectorySetManager est une implémentation qui permet de reproduire l'arborescence des répertoires du système de fichier sous forme d'ensemble hiérarchiques.

Ainsi, pour un répertoire "multiset" défini comme racine de l'entrepôt (paramètre filesystem.directory), ayant cette structure :

-set1
  -set11
-set2

on aura la "vue" OAI-PMH sous forme de sets OAI :

Configurations de tests pour le moissonneur

Des répertoires représentant des entrepôts "File System" de test sont fournis dans le répertoire conf/properties/filesystem/test-repository.

Ces entrepôts peuvent servir à tester un moissonneur OAI, il suffit de suivre les instructions dans le fichier conf/properties/filesystem/test-repository/README.txt.

Pour un test basic de bon fonctionnement, il suffit de définir les propriétés suivantes (dans ori-oaicat.properties) :

filesystem.directory=/path/to/install/ori-oai-repository/conf/properties/filesystem/test-repository/repository1
filesystem.md.namespace=http://www.openarchives.org/OAI/2.0/oai_dc/
filesystem.filter=*.xml

En lancant ensuite le module, dans l'IHM on doit avoir 3 fiches oai_dc, sans ensemble OAI définis :

  • No labels