2.1. La modélisation des documents d’archives sur support numérique
Description du modèle OAIS
Le modèle de référence OAIS propose une modélisation des documents d’archives (l’objet d’information ou Information Object au sens du modèle), physique, analogique comme numérique, qui est conçue comme une combinaison d’objets et d’informations sur les données (donc des métadonnées) qui permettent de rendre celles-ci intelligibles par un individu.
Fig. 13 : modélisation des objets d’information au sens de la norme OAIS (source: Modèle de référence pour un Système ouvert d’archivage d’information (OAIS), livre magenta, pratique recommandée par le comité consultatif pour les systèmes de données spatiales, 2e édition, 2017, , https://public.ccsds.org/Pubs/650x0m2%28F%29.pdf, p. 4-24)
NB : l’astérisque correspond au caractère répétable d’une entité ou d’une relation. Par exemple, une information de représentation peut avoir elle-même besoin d’une information de représentation.
Qu'est-ce qu'un objet d'information dans le modèle OAIS ?
Le modèle de référence OAIS explique qu’un objet d’information est constitué des composantes suivantes :
Des données, écrites sur un support, physique, analogique ou numérique, qui constituent l’objet de données (data object), donc le cœur de l’information à préserver. Pour les données numériques, il s’agit du train binaire correspondant à l’encodage technique ;
Les informations dites de représentation (Representation Information), qui permettent de rendre les données intelligibles et les transforment en objets d’information. Ces informations peuvent prendre plusieurs formes :
Des informations de structure (Structure Representation Information) : organisation des fichiers composant un site web ou un enregistrement audiovisuel encodé sous forme d’un format de fichiers conteneur ; spécifications des formats de fichiers, permettant de comprendre comment les données sont encodées techniquement ; description de la structure d’un tableur ou des tables d’une base de données ;
Des informations sémantiques (Semantic Representation Information) : il peut s’agir des outils permettant de comprendre la langue utilisée pour coder l’information (dictionnaire, grammaire), mais aussi de toute la documentation présentant le codage métier des informations dans un registre (ex. dictionnaire des codes utilisés dans une base de données) ;
Toute autre information utile (Other Representation Information).
Fig. 14 : modélisation des informations de représentation au sens de la norme OAIS (source: Modèle de référence pour un Système ouvert d’archivage d’information (OAIS), livre magenta, pratique recommandée par le comité consultatif pour les systèmes de données spatiales, 2e édition, 2017, https://public.ccsds.org/Pubs/650x0m2%28F%29.pdf, p. 4-27)
Une modélisation de l'information applicable aux documents d'archives sur support physique
Cette modélisation de l’information s’applique très bien aux documents d’archives sur support physique, par exemple à un instrument de ratification d’un traité international :
information de structure : relation entre l’acte de ratification d’un traité et le sceau qui valide l’acte ;
information sémantique : langue utilisée pour rédiger l’acte (ici le français).

Fig. 15 : Instrument de ratification par la Mauritanie du traité de coopération avec la France signé le 19 juin 1961 (source : ministère des Affaires étrangères - France)