Définition de nouveaux sets

Objectif :

  • On veut ajouter des nouveaux sets OAI afin de proposer aux moissonneurs des ensembles de fiches selon un critère précis.
  • Dans cet exemple, on veut utiliser la métadonnées dc:publisher du format Dublin Core, et en fonction de sa valeur, dire si telle fiche appartient ou non à tel set.

Les sets du module repository sont construits d'après un vocabulaire au format VDEX géré par le module vocabulary. Ce vocabulaire contient les valeurs de référence qui seront comparées à la valeur enregistrée dans la fiche pour une métadonnée ciblée. Cette valeur saisie dans la fiche est définie par une expression XPATH.

Etape 1 : module vocabulary

Il faudra éventuellement ajouter un vocabulaire dans le repertoire "conf/properties/ori_vocabularies/override" du module vocabulary. Par exemple my-univ-sets.xml.

Ce sera notamment le cas si les vocabulaires par défaut ne conviennent pas :

  • besoin propre dans tel(s) module(s) ;
  • restriction de la liste de valeurs d'un vocabulaire existant par défaut ;
  • personnalisation des noms (labels) des sets.

Voici un exemple avec deux sets :

<?xml version="1.0" encoding="utf-8"?>
<vdex:vdex xmlns:vdex="http://www.imsglobal.org/xsd/imsvdex_v1p0"
xmlns:orioai="http://www.ori-oai.org/static/xsd/orioaivocab"
xmlns:xforms="http://www.w3.org/2002/xforms"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.imsglobal.org/xsd/imsvdex_v1p0 http://www.imsglobal.org/xsd/imsvdex_v1p0.xsd"
profileType="flatTokenTerms">
<vdex:vocabName>
<vdex:langstring language="fr">my-univ-sets</vdex:langstring>
</vdex:vocabName>
<vdex:vocabIdentifier isRegistered="false">my-univ-sets</vdex:vocabIdentifier>

<vdex:term validIndex="true">
<vdex:termIdentifier>Set1</vdex:termIdentifier>
<vdex:caption>
<vdex:langstring language="fr">[Label pour Set1]</vdex:langstring>
</vdex:caption>
</vdex:term>

<vdex:term validIndex="true">
<vdex:termIdentifier>Set2</vdex:termIdentifier>
<vdex:caption>
<vdex:langstring language="fr">[Label pour Set2]</vdex:langstring>
</vdex:caption>
</vdex:term>

</vdex:vdex>
Etape 2 : module repository

Ensuite, il faut déclarer dans le fichier "conf/properties/repository-sets.xml" du module repository, un bean de class OaiSetInfos "mySets" référençant le vocabulaire défini plus haut en correspondance avec l'expression XPATH de l'attribut valueXpath :

<bean id="mySets"
class="org.orioai.repository.domain.model.set.OaiSetInfos"
init-method="init">
        <property name="vocabularyId" value="my-univ-sets"/>
        <property name="rootTag" value="vdex"/>
        <property name="termXpath" value="//vdex:term"/>
        <property name="valueXpath" value=".//vdex:termIdentifier"/>
        <property name="setSpecXpath" value="vdex:termIdentifier"/>
        <property name="setNameXpath"
value="vdex:caption/vdex:langstring[@language = 'fr']"/>
        <property name="vocabularyNameXpath"
value="//vdex:vocabName/vdex:langstring[@language = 'fr']"/>
        <property name="vocabularyNameDefault" value="my-univ-sets"/>

        <property name="xpathSources">
            <map>
                <entry>
                    <key>

<value>http://www.openarchives.org/OAI/2.0/oai_dc/</value>
                    </key>
                    <bean
class="org.orioai.repository.domain.model.set.OaiSetSourceInfos">
                        <property name="xpath">
                            <list>
                                <value>//dc:publisher</value>
                            </list>
                        </property>
                    </bean>

                </entry>
            </map>
        </property>
    </bean>

Enfin, il faut déclarer ce bean dans la liste du bean setManager (toujours dans le fichier repository-sets.xml) :

<property name="setInfosList">
<list>
...
...
<ref bean="mySets"/>
</list>
</property>
Etape 3 : module indexing

Si ce n'est pas déjà la cas, il faut indiquer au moteur d'indexation que la métadonnée doit être indexée, pour que sa valeur puisse être comparée aux valeurs du vocabulaire de référence.

Pour cela, il faut ajouter le XPATH de la métadonnée dans la section du format correspondant (dans l'exemple //dc:publisher) dans le fichier properties/liusConfig.xml du module indexing :

<!-- DC -->
<xmlFile ns="http://purl.org/dc/elements/1.1/" setBoost="1.0">
<indexer class="org.orioai.indexing.index.indexer.OriOaiXmlFileIndexer">
<mime>text/xml</mime>
</indexer>
<fields>
...
...
<luceneField name="%2F%2Fdc%3Apublisher" xpathSelect="//dc:publisher" type="Text" setBoost="1.5"/>

...
<searchResult>
<fieldsToDisplay setHighlighter="true">
...
<luceneField name="%2F%2Fdc%3Apublisher" label="//dc:publisher"/>
...


     Note : dans cet exemple, le champs dc:publisher est déjà déclaré dans la configuration par défaut.

Attention : si la valeur définissant la correspondance entre le vocabulaire VDEX et la fiche possède des caractères spéciaux, il peut être nécessaire de modifier également le fichier configIndexing.xml afin de définir une substitution de caractère. Par exemple dans le cas d'une valeur contenant une URL :

<replacement stringToReplace=":" stringReplacement="@">
      <metadata>md-ori-oai-id</metadata>
      <metadata>md-ori-oai-namespace</metadata>
      <metadata>[ajouter ici le nom du champ Lucene utilisé pour le set]</metadata>
</replacement>

La procédure complète est décrite dans la documentation du module ORI-OAI-indexing, section "Ajout d'un nouveau xpath à indexer dans le format" :

Personnalisation de la configuration

  • No labels