ARK à la BnL

La BnL et l’initiative « ARKs in the Open »

 

En 2001, les ARK ont été introduits par la « California Digital Library » (CDL). Pendant de nombreuses années, la CDL a servi d’incubateur pour l’infrastructure ARK, en maintenant un registre d’utilisateurs et en fournissant un service de « résolveur global » (http://n2t.net). En 2018, la CDL et DuraSpace (maintenant LYRASIS) ont annoncé une collaboration visant à créer une communauté internationale autour des ARK : le projet ARKs in the Open. 33 organisations sur 4 continents ont déjà manifesté leur intérêt et leur soutien pour ce projet, parmi elles la Bibliothèque nationale du Luxembourg. Afin de garantir une évolution continue du projet, les ARK et l’infrastructure ARK se détachent progressivement de la CDL en se développant en partenariat avec les organisations et les membres de la communauté.

Dans un souci de suivre les normes internationales et de coopérer en parallèle à leur développement, la BnL participe au groupe de travail technique du projet par le biais de Roxana Maurer, responsable de la préservation numérique et de l’implémentation technique de « persist.lu ». Le « Technical Working Group » supervise le développement et la maintenance des spécifications, des logiciels et des serveurs qui prennent en charge l’infrastructure de la communauté ARKs-in-the-Open.

 

Champs d’application

Les premiers documents à recevoir des ARK sont les documents numérisés par la BnL et consultables sur le site eluxemburgensia.lu. Plus de 100.000 ARK ont été attribués à des objets numérisés : quotidiens et hebdomadaires, manuscrits, livres et affiches.

Un deuxième volet d’attribution en masse des ARK a commencé au début du mai 2020. Quelques milliers d’éditions nées numériques (la plupart en format PDF) de plusieurs quotidiens et hebdomadaires luxembourgeois sont intégrées dans le système de préservation à long terme et reçoivent des ARK dans ce processus. Il en est de même pour les collections de l’archive web de la BnL.

Les notices bibliographiques et les notices d’autorité sont également éligibles pour recevoir des ARK. Une première tranche pourrait viser les notices bibliographiques des livres en format papier numérisés par la BnL.

 

Technical choices and associated metadata

 

The BnL has decided not to use prefixes in order to differentiate between collections or types of resources. Thus, the ARK remain entirely opaque: there is no possibility to distinguish between  https://persist.lu/ark:70795/g1v0gx, which references a digitized book (“Grammaire complète du nom ou substantive” by Pierre-Victor Sturm) and https://persist.lu/ark:70795/tjhcdk , which points to a digital daily newspaper (January 4th,1945 edition of the “Escher Tageblatt”).

 

Using the inflection “? “, the user can access the metadata made available by the BnL for its ARKs. Here is the example for ARK ark:70795/ghmrs9:

{

  “persistence”: {

    “objectAvailability”: “lifetime”,

    “objectContentChange”: {

      “contentVariance”: “rising”,

      “contentGrowthOverTime”: false

    },

    “arkNonReassignment”: true,

    “arkOpacity”: true,

    “arkCheckCharacter”: true

  },

  “erc”: {

    “what”: “D’Wäschfra”,

    “when”: “1880-03-06”,

    “type”: “digitized newspaper”,

    “format”: “METS/ALTO”

  },

  “owner”: “Bibliothèque nationale du Luxembourg (=) National Library of Luxembourg (=) BnL”,

  “target”: “http://www.eluxemburgensia.lu/BnlViewer/view/index.html?#issue:3728042″,

  “updated”: “2020-03-31T11:50:29.917Z”

}

 

On peut y trouver 3 types de métadonnées :

1. Informations sur l’ARK :

  • l’organisation qui a généré l’ARK (« owner »”)
  • l’URL courant pour la ressource (« target »)
  • la dernière mise à jour de l’ARK (« updated »)

2. Informations sur le contenu de la ressource dans le format « erc »   (Electronic Resource Citation)

3. Informations sur

  • les choix techniques :
    • l’ARK est opaque
    • l’ARK ne peut plus être réattribué, une fois publié
    • l’ARK utilise un caractère de contrôle
  • les politiques concernant l’objet numérique :
    • « objectAvailability: lifetime » = on s’attend à ce que l’objet soit disponible tant que le fournisseur existe
    • « contentVariance: rising » =  le contenu précédemment enregistré peut changer au cours d’une migration de format et peut être corrigé ou enrichi à tout moment (par exemple, par des métadonnées complémentaires)
    • Ces métadonnées suivent les lignes directrices exposées dans l’article : Persistence Statements: Describing Digital Stickiness.