Chapitre 9 Les principaux problèmes à résoudre pour l'archivage numérique
A la fin de cette partie sur les multiples visages du document numérique[1], nous pouvons identifier les principaux problèmes que nous aurons à résoudre pour l'archivage long terme des documents numériques. Ces problèmes seront repris en détail dans la suite de ce cours.
9.1 Le stockage et la préservation des bits
Le document numérique se présente toujours sous la forme d'un ou d'un ensemble de séquences de bits. |
Le premier problème à résoudre sera d'assurer au cours du temps la préservation et l'intégrité de ces séquences de bits. Ce point sera analysé dans la partie VI consacrée au stockage.
9.2 Extraire l'information sous forme intelligible
Comment passer du document sous sa forme numérique à une information intelligible que nous saurons lire, comprendre, interpréter ?
Nous pourrions penser qu’il suffit de connaitre le format du fichier ? La question est beaucoup plus complexe que l’on peut l’imaginer :
Le format est-il pérenne ou va-t-il disparaître des environnements techniques sur le court ou moyen terme ? Il existe des milliers de formats de données. Certains disparaissent, d’autre sont inventés. Les formats propriétaires non publiés vous ligotent aux logiciels des mêmes propriétaires,
Disposerons-nous toujours, dans 10 ou 20 ans, de logiciels permettant de lire les données dans ce format ?
La spécification du format dont nous disposons est-elle complète, précise, exacte ? Qui en assure la conservation à long terme ?
Nos données[2] sont-elles réellement conformes au format supposé ? Est-ce qu’on a pu le vérifier ?
En outre, la question du format de résoudra qu’une partie du problème. Pour des informations scientifiques, économiques, statistiques complexes, nous aurons besoin d’informations complémentaires pour accéder réellement à la sémantique de l’information.
Telles sont les questions abordées dans la partie 7 consacrée aux formats.
9.3 – Retrouver notre document au milieu de millions d'autres
Comment évaluer l’adéquation d’un document à un usage déterminé ? Ce sera l’objet des métadonnées[3] descriptives qui permettront à l’utilisateur futur de découvrir les documents correspondants à ses besoins.
Les métadonnées joueront également un rôle essentiel pour aider l’utilisateur à comprendre et à interpréter correctement les documents extraits de des archives : pouvoir identifier les documents de façon unique et surtout pérenne est essentiel, savoir pourquoi et dans quelles conditions ce document a été produit, quels sont les relations qui existent entre un document donné et d’autres documents archivés, etc.
Ces questions seront analysées dans la partie 9 consacrée aux métadonnées.
9.4 – Disposer d'éléments probants sur l'intégrité et l'authenticité du document

Est-ce que nous pouvons faire confiance dans notre document numérique ? Quels éléments avons-nous pour démontrer son intégrité[4] et son authenticité[5] ?
Quelle pourra être la valeur de ce document devant un tribunal, dans le cadre d’un contentieux ?
Tous ces aspects juridiques seront examinés dans la section 10
9.5 Conclusions
La résolution de ces quatre problèmes essentiels : stockage, formats, métadonnées, valeur probante ne pose pas que des questions techniques, loin de là.
Nous verrons qu’il subsiste de nombreux besoins en matière normative et en matière juridique. Nous pouvons ajouter que les aspects organisationnels, les stratégies vont également jouer un rôle essentiel. Enfin les questions de coût pèseront lourd dans toutes les décisions.
Nous sommes prêt maintenant pour aborder tous ces sujets plus en profondeur.