Indexing - Changements de version

Changements version 1.7.0

TODO Grégoire

Préciser les changements apportés en 1.7, ou dire aucun changement si c'est le cas

Modifications de la version 1.6

De nouvelles fonctionnalités ont été ajoutées au module d'indexation.

L'index créé à partir de la version 1.5 n'est pas compatible avec la version 1.6. Il faut donc le supprimer en utilisant le bouton de réinitialisation de l'index dans la partie Visualisation puis la fonction de réindexation complète dans les modules Ori-Oai-Workflow et Ori-Oai-Harvester.

Plus d'information sur la migration de la version 1.5 à la version 1.6 sur cette page.

Nouvelles fonctionnalités

Le module d'indexation contient un gestionnaire de liens brisés. Différents développements ont été réalisés pour enrichir ce gestionnaire :

  • Il est possible d'envoyer un mail automatique à l'administrateur pour lui indiquer les nouveaux liens brisés.
  • Le mail contient un pièce jointe au format CSV pour faciliter l'analyse du problème.
  • Une tâche planifiée a été ajoutée pour lancer automatiquement le gestionnaire.

Le format TEF est maintenant géré par le module.

La partie Visualisation du module contient un onglet "Suppression manuelle de fiches" pour supprimer une fiche seule ou toutes les fiches provenant d'un même entrepôt.

Un nouvel onglet permet de visualiser toutes les valeurs indexées pour un champ donné.

Un processus gère l'optimisation automatique de l'index.

Une tâche planifiée a été ajoutée pour optimiser automatiquement l'index.

Concernant le système de tri des résultats, les champs multivalués sont triés à partir de la première valeur, les autres valeurs n'étant pas prises en compte pour le tri. Aussi les résultats peuvent maintenant être triés par auteur indépendamment du format.

Fichier de configuration

Le format TEF est maintenant inclus dans la configuration.

Un nouveau paramètre permet de planifier le gestionnaire de liens morts.

L'e-mail de l'administrateur ainsi que le smtp de l'établissement sont requis dans le fichier configIndexing.xml pour l'envoi de courriers électroniques.

Un nouveau paramètre permet de planifier l'optimisation de l'index.

Une partie nommée "Gestionnaire de liens morts et crawler web" remplace la partie concernant le crawler.

De nouvelles valeurs non modifiables concernant les liens brisés ont été ajoutées.

Un nouveau bloc "autor_sort" a été créé pour trier les résultats par auteur indépendamment du format.

Une balise "noticesToNotIndex" a été ajoutée pour ne pas indexer automatiquement certaines fiches.

Modifications de la version 1.5


Le module d'indexation a subi de nombreuses modifications et ajouts.

L'index créé à partir de la version 1.4 n'est pas compatible avec la version 1.5. Il faut donc le supprimer en utilisant le bouton de réinitialisation de l'index dans la partie Visualisation puis la fonction de réindexation complète dans les modules Ori-Oai-Workflow et Ori-Oai-Harvester.

Nouvelles fonctionnalités

Les performances de la recherche ont été améliorées grâce à un nouveau système de tri géré par Lucene.

Le module d'indexation utilise maintenant le champ N d'une vCard.

Un champ a été ajouté dans l'index pour obtenir un identifiant unique.

Il est maintenant possible d'optimiser manuellement l'index grâce au bouton "Optimiser l'index" situé dans la page "Gestion de l'index" de la partie Visualisation.

Une visualisation de la progression du crawling de l'index est maintenant possible.

Un nouvel onglet "Métadonnées et UTF-8" a été ajouté dans la partie Visualisation. Il permet d'encoder en UTF-8 une valeur pour faciliter le remplissage du fichier liusConfig.xml.

Un bug a été corrigé dans l'onglet "Recherche" de la partie Visualisation.


Modifications de la version 1.4

Le module d'indexation comprend de nouvelles fonctionnalités.

L'index créé à partir de la version 1.1 n'est pas compatible avec la version 1.4. Il faut donc le supprimer en utilisant le bouton de réinitialisation de l'index dans la partie Visualisation puis la fonction de réindexation complète dans les modules Ori-Oai-Workflow et Ori-Oai-Harvester

Nouvelles fonctionnalités


Le format englobant a été inséré dans le module d'indexation. Le principe de cette fonctionnalité est d'insérer tous les formats d'un identifiant dans une seule entrée de l'index.

Ori-Oai-Indexing est maintenant capable d'indexer des documents en texte intégral. Cette fonctionnalité est utile dans le cadre du crawler web.

Un crawler Web est disponible dans cette nouvelle version. Il permet de rechercher le document plein texte à partir de la fiche indexée. Une tâche planifiée est ajoutée pour lancer automatiquement le crawling. Par ailleurs un pool de thread permet d'augmenter les performances du crawling.

Des champs ont été ajoutés pour la prise en charge du LOM-fr ainsi que du SupLOM-fr.

Le système de cache est maintenant assuré grâce à Ehcache. Certains caches sont maintenant persistants.

La partie visualisation a été améliorée et mise en conformité avec les design des autres modules.

Le système de highlighting a été amélioré.

Fichier de configuration


Une partie concernant les paramètres du crawler web a été ajoutée dans les options modifiables par l'utilisateur du fichier configIndexing.xml

  • No labels