Section 3 - Les multiples visages du document numérique

Chapitre 9 Les principaux problèmes à résoudre pour l'archivage numérique

A la fin de cette partie sur les multiples visages du document numérique[1], nous pouvons identifier les principaux problèmes que nous aurons à résoudre pour l'archivage long terme des documents numériques. Ces problèmes seront repris en détail dans la suite de ce cours.

9.1 Le stockage et la préservation des bits

un document numérique

Le document numérique se présente toujours sous la forme d'un ou d'un ensemble de séquences de bits.

Le premier problème à résoudre sera d'assurer au cours du temps la préservation et l'intégrité de ces séquences de bits. Ce point sera analysé dans la partie VI consacrée au stockage.

9.2 Extraire l'information sous forme intelligible

Comment passer du document sous sa forme numérique à une information intelligible que nous saurons lire, comprendre, interpréter ?

Nous pourrions penser qu’il suffit de connaitre le format du fichier ? La question est beaucoup plus complexe que l’on peut l’imaginer :

  • Le format est-il pérenne ou va-t-il disparaître des environnements techniques sur le court ou moyen terme ? Il existe des milliers de formats de données. Certains disparaissent, d’autre sont inventés. Les formats propriétaires non publiés vous ligotent aux logiciels des mêmes propriétaires,

  • Disposerons-nous toujours, dans 10 ou 20 ans, de logiciels permettant de lire les données dans ce format ?

  • La spécification du format dont nous disposons est-elle complète, précise, exacte ? Qui en assure la conservation à long terme ?

  • Nos données[2] sont-elles réellement conformes au format supposé ? Est-ce qu’on a pu le vérifier ?

En outre, la question du format de résoudra qu’une partie du problème. Pour des informations scientifiques, économiques, statistiques complexes, nous aurons besoin d’informations complémentaires pour accéder réellement à la sémantique de l’information.

Telles sont les questions abordées dans la partie 7 consacrée aux formats.

Des_bits_au_contenu

Une question centrale, passer des bits à un document intelligible.

9.3 – Retrouver notre document au milieu de millions d'autres

Comment évaluer l’adéquation d’un document à un usage déterminé ? Ce sera l’objet des métadonnées[3] descriptives qui permettront à l’utilisateur futur de découvrir les documents correspondants à ses besoins.

Les métadonnées joueront également un rôle essentiel pour aider l’utilisateur à comprendre et à interpréter correctement les documents extraits de des archives : pouvoir identifier les documents de façon unique et surtout pérenne est essentiel, savoir pourquoi et dans quelles conditions ce document a été produit, quels sont les relations qui existent entre un document donné et d’autres documents archivés, etc.

Ces questions seront analysées dans la partie 9 consacrée aux métadonnées.

9.4 – Disposer d'éléments probants sur l'intégrité et l'authenticité du document

Quelle valeur probante pour le document numérique ?

Est-ce que nous pouvons faire confiance dans notre document numérique ? Quels éléments avons-nous pour démontrer son intégrité[4] et son authenticité[5] ?

Quelle pourra être la valeur de ce document devant un tribunal, dans le cadre d’un contentieux ?

Tous ces aspects juridiques seront examinés dans la section 10

9.5 Conclusions

La résolution de ces quatre problèmes essentiels : stockage, formats, métadonnées, valeur probante ne pose pas que des questions techniques, loin de là.

Nous verrons qu’il subsiste de nombreux besoins en matière normative et en matière juridique. Nous pouvons ajouter que les aspects organisationnels, les stratégies vont également jouer un rôle essentiel. Enfin les questions de coût pèseront lourd dans toutes les décisions.

Nous sommes prêt maintenant pour aborder tous ces sujets plus en profondeur.

  1. Document numérique

    Tout écrit ou enregistrement considéré comme une unité documentaire (ISO 15489-1 "Records Management").

    Le document est donc un « ensemble d'informations enregistrées », considéré comme une unité qui pourra être utilisable à des fins de consultation ou comme preuve.

    Dans le domaine du numérique, l'association entre le support et l'information qu'il porte perd son sens. Le document pourra au cours du temps être stocké sur des supports différents sans pour autant que cela ne change sa nature ni n'altère son intégrité.

  2. Données

    Terme utilisé, en particulier en informatique, pour désigner une information.

  3. Métadonnées

    Étymologiquement, « méta » provient du grec signifiant « après, au-delà de, avec » :« méta » données signifie « au-delà des données », « qui dépasse les données », « qui englobe les données ». Les métadonnées sont donc des données sur les données, à propos des données, qui définissent, décrivent des données, leur contexte, leur contenu, leur structure des ainsi que leur gestion dans le temps.

  4. Intégrité

    L'intégrité d'un document renvoie au caractère complet et non altéré de son état, (ISO 15489 « records management »). Le document n'a subi aucune modification non tracée.

  5. Authenticite

    un document authentique est un document dont on peut prouver

    a) qu'il est bien ce qu'il prétend être,

    b) qu'il a été effectivement produit ou reçu par la personne qui prétend l'avoir produit ou reçu, et

    c) qu'il a été produit ou reçu au moment où il prétend l'avoir été.

    (ISO 15489 « records management »)

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimerRéalisé avec Scenari (nouvelle fenêtre)