Le processus de normalisation

La normalisation des notices dans Primo s’appuie sur un mécanisme appelé pipe. Un pipe est la série de traitements qui permettent de charger des notices dans Primo à partir d’une source externe (SIGB, Bibliothèque numérique, AOI, Plateforme d’apprentissage virtuelle, …).

Un pipe comporte 4 étapes de traitement :

1. Le moissonnage

Le Moissonnage est l’étape de traitement durant laquelle Primo va récupérer les notices fournies par une source externe. Ces notices peuvent être mises à disposition via un entrepôt OAI-PMH ou par un dépôt de fichiers sur un serveur FTP (File Transfer Protocol). La source signale à Primo les notices créées, modifiées ou supprimées depuis le dernier chargement.

2. La normalisation

Le processus de normalisation est le traitement par lequel Primo transforme des notices dans leur format d’origine en format PNX. Des règles standards de normalisation sont définies pour chaque source moissonnée. A titre d’exemple voici les règles de normalisation types appliquées par Ex Libris à des notices au format Unimarc.
Ces règles sont entièrement configurables pour exposer au mieux nos données :

  • Pour l’affichage
  • Pour les rebonds proposés
  • Pour l’indexation et particulièrement les facettes
  • Pour l’enrichissement des données
  • Pour la recherche
  • Pour le tri
  • Pour dédoublonner et ‘frbriser’
  • Pour les données de contrôle et l’accès au document

Les champs des notices PNX

Format xml standard d’enregistrement des notices bibliographiques dans Primo. La notice PNX est divisée en plusieurs blocs.

  • Le bloc <control> comprend tous les identifiants de la notice
  • Le bloc <display> comprend toutes les informations disponibles pour l’affichage
  • Le bloc <links> comprend tous les rebonds proposés
  • Le bloc <search> comprend tous les champs indexés
  • Le bloc <sort> comprend tous les champs utilisés pour le tri des résultats
  • Le bloc <facets> comprend toutes les facettes proposées pour la notice
  • Le bloc <dedup> comprend toutes les clefs utilisables par l’algorithme de dédoublonnage
  • Le bloc <frbr> comprend toutes les clefs utilisables pour la frbérisation
  • Le bloc <delivery> comprend toutes les informations nécessaires au calcul de la disponibilité
  • Le bloc <ranking> comprend les boosters affectés à la notice pour impacter son rang d’affichage dans le tri par pertinence.
  • Le bloc <addata> comprend les données utilisées par des services de Primo non présentes dans d’autres blocs. Les données renvoyées par les fonctions d’export bibliographiques (RIS, BIBTEXT,…) sont généralement tirées de cette section.
  • Le bloc <browse> comprend les entrées proposées pour la recherche parcourir.

La notice PNX permet de voir comment les données sont traitées dans Primo. Toutes ces données sont construites lors du processus de normalisation.

Astuce : Pour afficher une notice dans son format PNX ajoutez simplement &showPnx=true à la fin de l’URL (Uniform Resource Locator) lorsque vous êtes en affichage détaillé.

3. L’enrichissement

L’enrichissement est le processus par lequel Primo peut ajouter des données à des notices via un service tiers. Par exemple, c’est à cette étape de traitement que nous pourrons ajouter les résumés obtenus depuis le service Zebris.

4. Le chargement

Le calendrier des pipes

Nom du processusFréquenceHoraire

33PUDB_Alma_Unimarc_Regular
Quotidien08h30

33PUDB_Alma_Marc_Regular
Quotidien08h45

33PUDB_1886_Regular
Tous les lundis06h00

33PUDB_CanalU_Regular
Tous les mardis06h00

33PUDB_BabordNum_Regular
Tous les jeudis 06h00

Date de publication

Mis à jour le

Attention ! Certains établissements utilisent parfois de procédures complémentaires