BabordNum

Configuration du profil d’import « BabordNum »

Ce profil d’import est géré depuis l’instance Réseau. Il est accessible sous Découverte > Chargement des sources de données externes >Découverte – Profils d’import

Voici les principaux éléments de configuration

Mapping des données

Voici un tableau documentant les règles de transformation des données définies dans le fichier BabordNum-xml.drl :

Nom de la règleCondition (when)Action (then)
Types de doc : other pour absentnot exist "//*[local-name()='type']"Définit "other" dans discovery.resourceType.
Types de doc : autres casexist "//*[local-name()='type']"Transforme la valeur de type en fonction de correspondances spécifiques (ex. « Affiche » → « images ») et la définit dans discovery.resourceType.
Affichage Auteurs Brief Displayexist "//*[local-name()='creator']"Copie la valeur de creator dans discovery.local1. Champ local dédié à l’affichage abrégé de la notice
Affichage Editeur Brief Displayexist "//*[local-name()='publisher']"Ajoute un suffixe : à la valeur de publisher et la définit dans discovery.local2. Champ local dédié à l’affichage abrégé de la notice
Copy titleexist "//*[local-name()='title']"Copie la valeur de title dans dc.title après avoir remplacé & par &.
Copy creatorexist "//*[local-name()='creator']"Copie la valeur de creator dans dc.creator.
Copy contributorexist "//*[local-name()='contributor']"Copie la valeur de contributor dans dc.contributor.
Copy descriptionexist "//*[local-name()='description']"Copie la valeur de description dans dc.description après avoir remplacé les entités HTML (&lt;<, &gt;>).
Copy publisherexist "//*[local-name()='publisher']"Copie la valeur de publisher dans dc.publisher.
Copy subject exist "//*[local-name()='subject']"Copie la valeur de subject dans dc.subject.
Copy dateexist "//*[local-name()='date']"Copie la valeur de date dans dc.date.
Copy languageexist "//*[local-name()='language']"Copie la valeur de language dans dc.language.
Copy coverageexist "//*[local-name()='coverage']"Copie la valeur de coverage dans dc.coverage.
Copy relationexist "//*[local-name()='relation']"Copie les valeurs de relation commençant par https dans dc.relation.
Copy rightsexist "//*[local-name()='rights']"Copie la valeur de rights dans dc.rights.
Copy source to identifier : cas du PPN avec PPN Balises html interprétéesexist "//*[local-name()='source']//*[local-name()='a'][contains(@href, 'sudoc')]Le PPN est encadré d’une balise htm <a> dont le href est l’url de la notice dans le SUDOC. Si le href contient SUDOC, alors on extrait le PPN de l’URL et on ajoute le préfixe "Identifiant du Sudoc : " .
Copy source to identifier : cas du PPN avec PPN Balises html non interprétéesexist "//*[local-name()='source'][contains(., 'sudoc')]Dans certains cas la balise html n’est pas correctement interprétée. Si dc.source = « sudoc » alors on extrait le PPN de l’URL.
Copy identifier Cote du document originalexist "//*[local-name()='identifier']"Ajoute le préfixe "Cote du document original : " à la valeur de identifier commençant par "Université" et la définit dans dc.identifier.
Copy identifier URIexist "//*[local-name()='identifier']"Ajoute le préfixe "URI : " à la valeur de identifier commençant par "http" et la définit dans dc.identifier.
PPN en clef de fusion Balises html interprétéesexist "//*[local-name()='source']//*[local-name()='a'][contains(@href, 'sudoc')]Le PPN est encadré d’une balise htm <a> dont le href est l’url de la notice dans le SUDOC. Si le href contient SUDOC, alors on extrait le PPN de l’URL pour construire un champ « discovery ».« local3 »
PPN en clef de fusion Balises html non interprétéesexist "//*[local-name()='source'][contains(., 'sudoc')]Dans certains cas la balise html n’est pas correctement interprétée. Si dc.source = « sudoc » alors on extrait le PPN de l’URL pour alimenter le champ « discovery ».« local3 »

Traitement des types de documents

Les données dans le dc.type sont parfois multivaluées et très hétérogènes, car elles ne sont pas normalisées dans Babord Num.

Pour faciliter le traitement, les espaces sont supprimés avant d’appliquer la table de correspondance suivante. Pour les données multivaluées, seule la première occurrence du dc.type est traitée.

Type d’origineType transformé
Afficheimages
Documentcartographiquemaps
Gravéimages
Gravureimages
Herbierother
Imagefixeimages
Objetother
Photographiesimages
Photographieimages
TextDomainepublicbooks
TextDessinimages
TextPartitionmusicalescores
TextTextbooks
texteimprimébooks
Textemanuscritreprographiémanuscripts
Textemanuscritmanuscripts
Textbooks
Partitionmusicalescores

Fusion des notices

Dans certains cas, le document signalé dans Babord Num est aussi signalé dans le Sudoc pour la version imprimée et la version électronique. Dans le cas de ce double signalement, le PPN de la notice imprimée est ajouté sous la notice BabordNum dans un champ dc.source.

Nous extrayons le PNN de ce champ (cf. table de maping) pour construire un champ « discovery ».« local3 ». Ce champ sert à la création d’une clef de fusion (clef L5). En parallèle, une clef (L3) est construite sur la base des PPN présent en 035, 035, 452, 455 et 456 des notices Unimarc. Ce dispositif permet la fusion de la notice dublin core avec la notice signalant le document imprimé et la notice de la version numérisée.

cdf. Détection des doublons (Dedup)(Primo VE)

Date de publication

Mis à jour le

Attention ! Certains établissements utilisent parfois de procédures complémentaires