Page History

Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.
Comment: Migrated to Confluence 4.0

...

Dans le cadre de la gestion des publications scientifiques et de l'interaction d'ORI-OAI avec la plateforme HAL, les modules MD-EDITOR, SEARCH ORI-OAI-md-editor et ORI-OAI-search s'appuient sur des vocabulaires générés à partir des référentiels HAL.

Afin de limiter la dépendance directe d'ORI-OAI vis-à-vis de services extérieurs, le mécanisme de provider providers du module VOCABULARY ORI-OAI-vocabulary n'a pas été utilisé pour générer dynamiquement et régulièrement les vocabulaires à partir des référentiels HAL.

En contrepartie, la démarche suivante est proposée :

  • ORI-OAI-VOCABULARY vocabulary 1.7.0 fournit une version de ces vocabulaires comme vocabulaires statiques officiels (répertoire official, voir ici) :
    Code Block
    titleListe des vocabulaires générés à partir des référentiels HAL
    dcfr_affiliations.xml
    dcfr_audiences.xml
    dcfr_distant_embargos.xml
    dcfr_files_formats.xml
    dcfr_labs_addresses.xml
    dcfr_labs_countries.xml
    dcfr_labs_names.xml
    dcfr_labs_short_names.xml
    dcfr_reviews.xml
    dcfr_subjects.xml
    dcfr_types_publi.xml
    
  • ORI-OAI-VOCABULARY vocabulary 1.7.0 fournit un script python de une archive jar exécutable dédiée à la génération de ces vocabulaires (utils/misc/generate/get_ws_ori-oai-ext-hal-vocab.pyjar)
    Warning

    Il incombe donc aux établissements gérant leurs publications scientifiques avec ORI-OAI de mettre à jour leurs vocabulaires au moyen de

...

  • cette jar.

Utilisation

...

de la jar ori-oai-ext-hal-vocab.jar

Le plus simple est d’exécuter la target Ant fournie avec le module ori-oai-vocabulary. Donc à la racine des sources de ce dernier, exécuter :

Code Block

ant gen-hal-vocabs

Il est bien sûr également possible d'appeler la jar directement en ligne de commande de la manière suivante :

Code Block

java -Xms256m -Xmx256m -jar ori-oai-ext-hal-vocab.jar
Warning

Le processus de génération des vocabulaires est long. À titre d'exemple, sur une machine dotée de 8GB de mémoire vive et d'un processeur Intel(R) Core(TM) i7-2600 CPU @ 3.40GHz, il dure une quarantaine de minutes

Certains des vocabulaires listés ci-dessus sont susceptibles d'évolutions fréquentes. C'est le cas par exemple des vocabulaires issus des référentiels de laboratoires (dcfr_labs_*), de tutelles (dcfr_affiliations) ou de revues (dcfr_reviews). Pour chacun de ces vocabulaires, on donne ci-dessous la ligne de commande nécessaire à sa génération.

Info

Le script get_ws_vocab.py étant écrit en python, il nécessite bien sûr une installation fonctionnelle de python sur la machine où seront générés les vocabulaires.
Notez que ce script fait appel aux modules SOAPpy et lxml qui ne sont pas fournis avec les distributions python. Il faudra donc prendre soin d'installer également ces modules.