4.1. Les qualités des formats pour les besoins archivistiques
Il existe une grande variété de formats informatiques pour l'enregistrement des images numérisées. Le but de l'archiviste est de choisir un format :
pérenne
libre, ouvert, et décrit par une norme
universel, lisible sur toutes les plateformes
pouvant être lu par des logiciels anciens en fichier de diffusion (compatibilité descendante des copies)
pouvant contenir des métadonnées
A ces préceptes, on pourrait presque ajouter : le format de diffusion devrait être différent de celui du fichier maître d'archivage, permettant de le reconnaître d'un seul coup d'œil dans les répertoires.
Remarque :
Dans cette proposition, le format est celui qui correspond à l'objectif, on n'utilisera pas une « recette universelle » pour la comptabilité et pour les reproductions de tableaux, le résultat ne serait bon à rien mais mauvais à tout !
Le format pérenne
C'est presque une hérésie de parler de format pérenne dans un monde changeant comme celui de l'informatique. Cependant, il existe des « stabilisateurs » de format, qui sont le nombre des usagers ayant utilisé tel ou tel format sur des quantités importantes de fichiers.
Au nombre de ceux-ci, on reconnaît les formats Tiff, Jfif (improprement appelé jpeg), PDF et png
Le format du domaine public
Le format choisi ne doit pas être propriétaire, c'est à dire que ses clés de développement doivent être publiques et non soumises à droits d'exploitation limités. C'est le cas des formats dont nous allons parler.
Le format universel
Les formats cités dans ce cours ont tous « élu domicile » sur les plateformes Windows-Mac-Unix-linux, et sont lisibles parce que leurs formats ont peu changé avec le temps. Dans le cas du PDF, un format spécial « archives » a été créé et répond à la norme ISO 19005. Cette démarche vise à garantir une lecture dans le futur par une stabilisation du standard, qui cependant en est déjà à sa troisième version depuis sa création...
La compatibilité descendante
Les formats choisis doivent aussi pouvoir être lus par des logiciels datant de quelques années, ou des logiciels grégaires comme les lecteurs d'images intégrés à Windows. Cette compatibilité sert aussi à faire fonctionner des banques de données propriétaires ou libres qui se basent sur des standards anciens pour éviter le paiement de brevets.
Le contenu de métadonnées
Les formats devront pouvoir contenir des métadonnées au langage XML pour que lorsque l'image est détachée de son site de diffusion, l'utilisateur puisse toujours l'identifier complètement sans risque d'interversion lors de la copie (fastidieuse) de légendes en ligne. Les métadonnées sont une part essentielle du contenu du fichier maître. Le choix des champs complétés doit être judicieux pour conserver une compatibilité descendante.
Complément : Particularités des formats « photo »
L'avantage des formats d'images courants est qu'ils sont destinés à l'échange, donc en principe stables, compatibles et ouverts.
Une particularité existe cependant pour le format « Adobe Photoshop® » qui est un format propriétaire de la société Adobe®. Ce format mondialement reconnu offre une option de compatibilité descendante à l'enregistrement dans le logiciel Adobe Photoshop® (maximiser la compatibilité). Il est par ailleurs reconnu par nombre de logiciels libres ou d'autres éditeurs à cause de son omniprésence dans le milieu de l'image. Il reste cependant la propriété de son créateur qui le fait évoluer en permanence.
On notera aussi une exception avec les nouveaux formats « raw » des appareils photo et chambres numériques, qui peuvent nécessiter un filtre de rendu propriétaire à chaque constructeur, livré avec l'appareil de prise de vues. Le format « raw » est un peu comme les anciens négatifs argentiques, il est nécessaire d'ajuster les valeurs lors du « tirage » de la photo. Les clichés réalisés dans ces formats devront donc être convertis en formats universels pour l'archivage permanent.