UNIT - vignettes dans les résultats

Le site UNIT , celui de l'Institut de la Montagne et d'autres (Rennes1, ENT, ...) affichent au travers du moteur de recherche ori-oai-search des vignettes sur les ressources numériques.

Pour ce faire, ils utilisent tous à ce jour et individuellement un script qui fonctionne directement sur le serveur. Celui-ci est lancé régulièrement pour prendre des nouvelles copies d'écran des fiches nouvellement arrivées dans la base ORI-OAI.

La mise en place de ce script est décrite sur cette page .

Pour compléter cette description, on donne ici 3 scripts issus du script initial :

* shot.py qui permet de  faire des captures sur les notices qui n'ont pas de vignettes disponibles

* shot-imgs-404.py qui permet de lister les vignettes qui tombent en 404

* shot-one.py qui permet de faire une capture sur une vignette spécifiquement

Ces scripts, même si ils sont présentés ici, restent des scripts internes à manipuler avec précaution, il faut les adapter évidemment à son propre contexte.

L'idée est que shot.py génère les copies d'écran au niveau même du répertoire depuis lequel il a été lancé.

On fera lancer ce script via CRON en écrivant un fichier /etc/cron.daily/ori_screenshot comme ceci par ex. :

#!/bin/sh
cd /opt/ori/urlScreenshot/ori-imgs
sudo -H -u vincent python ../scripts/shot.py 2>&1 >  ~vincent/updateOriScreenshots.log

Ici on stocke donc les copies d'écran dans /opt/ori/urlScreenshot/ori-imgs

On fera pointer ce répertoire par Apache (ou autre serveur web) pour servir ces images via internet.

On pourra utiliser une configuration apache similaire à celle-ci :

Alias /ori-imgs/ "/opt/ori/urlScreenshot/ori-imgs/"
<Directory "/opt/ori/urlScreenshot/ori-imgs/">
	# Options FollowSymLinks Indexes
	Options FollowSymLinks
	AllowOverride None
	Order allow,deny
	Allow from all
	ErrorDocument 404 /ori-imgs/vignette_general_100.jpg
</Directory>

On notera qu'en cas d'"erreur 404" (la screenshot n'est pas présentée) on fournit une image générique "vignette_general_100.jpg".

Enfin, dans le cadre du moteur de recherche ori-oai, on pourra intégrer un code similaire à celui ci-dessous dans le fichier XSL de présentation, dc2.xsl par exemple pour le DC :

<div class="screenshot">
  <xsl:variable name = "location" select ="normalize-space(//dc:identifier[starts-with(normalize-space(.),'http')]|//dc:source[starts-with(normalize-space(.),'http')]|//dc:relation[starts-with(normalize-space(.),'http')])" />
  <a href="{$location}" target="_blank">
    <img src="/ori-imgs/thumb150-{$md-ori-oai-id}.png" class="navigation_document_screenshot" alt="" style="border: medium simple grey;" border="1"/>
  </a>
</div>
  • No labels