04 - Indexation et recherche dans ori-oai-indexing

Pour définir cette nouvelle métadonnée dans le module ORI-OAI-indexing, il est nécessaire

Recopie des fichiers de configuration

Pour définir cette nouvelle métadonnée dans le module ORI-OAI-indexing, il est nécessaire de modifier ces fichiers :

  • [PATH_CUSTOM_CONFIG]/ori-oai-indexing/config/fieldsConfig.xml
  • [PATH_CUSTOM_CONFIG]/ori-oai-indexing/config/solr_home/prod-public/conf/schema.xml

Par défaut, lors de l'initialisation de la configuration, ces fichiers ne sont pas présents. Ils doivent être recopiés manuellement depuis les sources du module vers le dossier cité ci-dessus.
Une fois le fichier recopié, vous pourrez le modifier et redéployer le module. Le fichier présent dans [PATH_CUSTOM_CONFIG]/ori-oai-indexing sera alors prioritaire sur celui fourni par défaut et votre configuration tiendra compte de vos modifications.

Les fichiers sont à recopier à partir des dossiers suivants en fonction du fichier :

  • fieldsConfig.xml : [ORI_HOME]/src/ori-oai-indexing-svn/indexingCore/src/main/resources/fieldsConfig.xml
  • schema.xml : [ORI_HOME]/src/ori-oai-indexing-svn/indexingCore/src/main/resources/solr_home/prod-public/conf/schema.xml

Fichier fieldsConfig.xml

Définir le Xpath où aller lire la donnée

Cette partie est délimitée par la balise <xmlFile ns="http://ltsc.ieee.org/xsd/LOM" prefix="lom" ....>.

A l'intérieur de celle-ci se trouve le format de métadonnées indexable qui nous intéresse : le format LOM. Pour plus de clarté ces dernières ont été triées par type (général, cycle de vie, méta-métadonnées, technique ...). La métadonnée que nous souhaitons ajouter se trouve dans la partie « Pédagogie ». A l'intérieur de cette partie, ajoutez la ligne suivante :

<field name="lom.educational.semanticDensity" xpathSelect="//lom:educational/lom:semanticDensity/lom:value"/> 

xpathSelect

Correspond au xpath permettant de retrouver la métadonnée à indexer

name

Donne un nom à cette métadonnée. Ce nom est obligatoirement le même que celui qui sera défini dans le fichier schema.xml.

Pour permettre de donner un libellé plus lisible à cette donnée dans l'affichage du moteur de recherche, il est possible de donner une correspondance avec un libellé trouvé dans un vocabulaire donné.
Pour cela, il faut s'intéresser au bloc <transformations>.

Ajoutez dans ce bloc ceci :

<metadata format="vocabulary:common_lom_educ_semantic_density" xpathSelect="//lom:educational/lom:semanticDensity/lom:value"/>

Ceci ajoutera des attributs dans la version "traduite" de la fiche, notamment le libellé associé à la valeur présente dans la fiche.

Fichier schema.xml

Ce fichier définit le schéma d'indexation et de recherche du moteur Solr.

Pour que notre nouvelle métadonnée soit prise en compte par Solr, il faut obligatoirement la définir ici en s'inspirant de la définition des autres métadonnées :

<field name="lom.educational.semanticDensity" type="string" indexed="true" stored="true" multiValued="true" />

name

Nom de la métadonnée. Doit obligatoirement être le même que celui défini dans fieldsConfig.xml

type

Type de la métadonnée. Comme ici, la métadonnée est une valeur dans une liste fermée de choix, elle doit être traitée en tant que token en dehors de toute langue. Dans ce cas, c'est le type string qui correspond dans Solr.

indexed

Dit si oui ou non on indexe la valeur pour pouvoir rechercher dessus.

stored

Dit si oui ou non on stocke la valeur pour pouvoir l'afficher depuis le moteur de recherche dans les résultats.

multiValued

Indique si cette métadonnée est multivaluée ou non.

Prise en compte des modifications

Sauvegardez ensuite ce fichier. Il vous reste alors à redéployer le module d'indexation. Cette opération se déroule en trois étapes :

  • Lancez : [ORI_HOME]/tomcat-indexing/bin/shutdown.sh pour stopper le serveur tomcat dédié au module d'indexation.
  • Placez-vous dans le répertoire « [ORI_HOME]/src/ori-oai-quick-install-svn » et tapez : ant all-indexing pour redéployer le module.
  • Lancez [ORI_HOME]/tomcat-indexing/bin/startup.sh pour démarrer le serveur tomcat dédié au module d'indexation.

Le module d'indexation est maintenant prêt à être utilisé.

  • No labels