2.2.1. Propriétés porteuses de sens (Significant properties)
Une des caractéristiques essentielles des objets d’information est constituée par ce qui a été désigné par l’expression de propriétés porteuses de sens (significant properties).
Historique de la notion
Ce concept a été défini à la fin des années 1990 dans le cadre de plusieurs projets de recherche et a fait l’objet d’une formalisation en 2008 dans le cadre du rapport-cadre rédigé par les membres du projet InSPECT (Investigating the Significant Properties of Electronic Content Over Time – accessible à l’adresse suivante : https://significantproperties.kdl.kcl.ac.uk/inspect-finalreport.pdf).
Définition :
La définition donnée par ce rapport (p. 3) des propriétés porteuses de sens est la suivante [NB : la traduction est de l’auteur] : « Les caractéristiques des objets numériques qui doivent être préservées au fil du temps afin d'assurer l'accessibilité, l'utilisation et la signification continues de ceux-ci, ainsi que leur capacité à être acceptés comme preuve de ce qu'ils sont censés enregistrer ».
Utiliser des propriétés porteuses de sens
Les propriétés porteuses de sens[1] sont donc les caractéristiques les plus importantes d’un objet d’information à préserver dans le temps, au-delà des changements technologiques subis par les objets de données. Elles doivent faire l’objet d’un recensement avant toute opération de préservation et leur maintien après l’opération doit faire l’objet de vérifications soigneuses.
Méthode :
Le rapport-cadre du groupe InSPECT fournit une méthodologie formalisée et documentée permettant d’étudier, pour une catégorie d’objets d’information, les propriétés porteuses de sens. Cette méthodologie repose successivement sur :
une analyse des objets eux-mêmes : sélection du type d’objet à analyser (ex. enregistrement sonore) ; recensement des propriétés au moyen des spécifications techniques ou normes disponibles ; identification de la finalité des différentes propriétés – contenu (ex. nombre de mots), contexte (ex. auteur), rendu (ex. taille de caractère), structure (ex. existence de pièces jointes), comportement (ex. existence d’animations) ; détermination des différents usages des objets et catégorisation des comportements attendus (ex. recréation de l’apparence visuelle) ; dépendance entre comportements attendus et propriétés ;
une analyse des besoins des utilisateurs de ces objets : identification des différentes catégories d’utilisateurs (producteur, chercheur, archiviste, etc.) ; identification des objets types manipulés par chaque catégorie d’utilisateur ; détermination des différents usages des objets et catégorisation des comportements actuels ; confrontation entre comportements attendus déterminés lors de la première phase et comportements actuels pour déterminer la liste des propriétés indispensables ; identification des propriétés non indispensables, dont la perte est acceptable lors des opérations de préservation.
Retour d'expérience : les Archives fédérales américaines
Des analyses ont d’ores et déjà été effectuées pour les images fixes matricielles, les messages électroniques, les enregistrements sonores, les textes structurés et les tableurs.
Les Archives fédérales américaines (National Archives and Records Administration) ont de leur côté procédé, pour chaque catégorie de format de fichiers, à ce recensement des propriétés porteuses de sens (https://github.com/usnationalarchives/digital-preservation).
Exemple :
À titre d’exemple, pour les images fixes (https://github.com/usnationalarchives/digital-preservation/blob/master/Still_Image_Formats/NARA_PreservationActionPlan_DigitalStillImage_20220714.pdf), il s’agit des propriétés suivantes :
taille de l’image ;
espace colorimétrique ;
profondeur de bits ;
orientation ;
présentation ;
compression ;
résolution ;
restitution visuelle ;
identifiant assigné lors de la capture ;
date de capture ;
type de caméra ;
titre ;
copyright ;
auteur
etc.