3.4. Le standard PREMIS (PREservation Metadata Implementation Strategies)

La Bibliothèque du Congrès héberge depuis 2005 un standard de métadonnées développé pour la préservation numérique par une équipe internationale sous l’égide d’Online Computer Library Center (OCLC) et du Research Libraries Group (RLG ): le standard PREMIS[1] (PREservation Metadata Implementation Strategies). Ce standard est devenu un standard de fait, largement utilisé par les institutions assurant des missions de préservation numérique.

Description de PREMIS

Ce standard de métadonnées propose un modèle de données articulé autour de cinq entités intervenant dans le processus de préservation numérique, selon le schéma suivant :

Fig.3 : Schéma du modèle de données PREMIS (source : Caplan (Priscilla), Comprendre PREMIS, The Library of Congress, 2009, 26 p., traduction française par Louise Fauduet, Clément Oury, Sébastien Peyrard, Jean-Philippe Tramoni [en ligne], disponible sur https://www.bnf.fr/fr/premis-preservation-metadata-implementation-strategies)

NB, dans ce schéma, bitstream correspond à des trains d’octets, décrits comme suit dans la documentation fournie : Les objets train d’octets sont des sous-ensembles de fichiers. On définit un objet train d’octets comme des données (octets) au sein d’un fichier qui 1) ont des propriétés communes dans une perspective de préservation, et 2) qui ne sont pas indépendantes car elles nécessitent l’addition d’un en-tête de ficher ou d’une autre structure. Donc, si l’on a par exemple un fichier dans le format AVI (audio-video interleaved), on peut vouloir distinguer le train d’octets audio du train d’octets vidéo, et les décrire comme des objets trains d’octets séparés.

Les entités intellectuelles correspondent à un ensemble cohérent de contenus décrits comme une unité (ex. un livre).

Les objets correspondent aux fichiers numériques (ex. un fichier au format PDF).

Les événements (ou actions) correspondent aux actions de préservation (ex. conversion du format d’un fichier).

Les agents correspondent aux personnes, aux organisations ou aux matériels et logiciels qui réalisent les événements (ou actions) sur les objets.

Les droits renseignent les autorisations qui sont données aux agents pour qu’ils effectuent les événements sur les objets.

Ce modèle de données constitue un guide pour identifier les métadonnées à enregistrer dans un système d’archivage dont l’objectif est d’assurer la préservation de documents d’archives sur support numérique, ainsi que pour générer les traces qui vont permettre de documenter les actions mises en œuvre par le système.

Le standard PREMIS ne constitue pas une solution toute faite

Il se focalise exclusivement sur l’identification des informations traçant les actions effectuées par les institutions en charge de la préservation d’objets numériques sur leurs propres objets, et recense ce qu’il convient de collecter et d’enregistrer dans ce cadre précis. PREMIS, en conséquence, ne s’intéresse pas aux métadonnées descriptives.

Conseil

Il n’est pas indispensable de transposer à la lettre le schéma du standard pour mettre un système d’archivage en conformité avec celui-ci. Il suffit, pour garantir la conformité, que les informations correspondant à des métadonnées PREMIS utilisées par le système d’archivage aient la même signification et la même sémantique que celles prévues dans le standard. 

La Bibliothèque du Congrès et la communauté qui maintiennent le standard PREMIS proposent un certain nombre d’outils (supports de présentation, vocabulaire contrôlé, logiciels, tableurs, scripts) pour faciliter la prise en main et l’utilisation de celui-ci.