Module 9 - Section 2 : Numériser les documents

11.1. Introduction aux choix faits dans les solutions de la DAF

Le document fournit des recommandations sur les caractéristiques techniques des fichiers images produits par la numérisation en fonction de la nature des documents traités et des usages envisagés. Ces recommandations, qui s'appliquent aux cas les plus fréquemment rencontrés, restent indicatives et peuvent être adaptées selon les objectifs précis poursuivis.

Un classement par grandes familles rassemblant des typologies cohérentes entre elles a été adopté : il permet ainsi de déterminer des lots lors du lancement d'un appel d'offres, afin d'optimiser la qualité en fonction des prestataires plus spécialisés dans un domaine que dans un autre.

Pour chaque type de document à numériser, trois usages distincts (et donc trois spécifications techniques différentes) sont en principe pris en compte dans ces tableaux de solutions :

  • La conservation : il s'agit d'obtenir une reproduction du document la plus fidèle possible à l'original à des fins de conservation pérenne et d'impression de haute qualité.

  • La diffusion : il s'agit de réaliser, à partir du fichier de conservation, une image du document en fonction de la qualité que l'on souhaite mettre à disposition du public. Cette reproduction doit permettre une transmission fluide sur les réseaux et par conséquent l'affichage rapide à l'écran des informations essentielles du document original, auquel les utilisateurs ne pourront plus accéder directement. Cette reproduction permettra également des travaux d'impression courants .

  • La visualisation : à l'inverse du fichier de diffusion, aucune impression de qualité ne sera possible à partir de ce fichier (notamment en raison de droits d'accès restreints pour certaines oeuvres comme les affiches, les photographies de grands noms...).

Selon les cas, un plan de numérisation peut viser dès l'origine ces trois cas de figure ou seulement une partie d'entre eux. De plus, la technologies de diffusion en ligne à partir de fichiers JPEG 2000 permettent l'utilisation directe du fichier de conservation pour la consultation, sans nécessiter la préparation spécifique d'un fichier de diffusion. De même, le logiciel de base de données en ligne peut générer ou contenir des copies d'aperçu à des résolutions inférieures, en général entre 1 200 et 2000 pixels sur le plus grand côté.

Les cas exceptionnels ou trop particuliers n'ont pas été abordés ici. Il est conseillé de procéder à des tests avec des sociétés compétentes ou spécialisées. Ne pas oublier de maintenir les métadonnées à l'intérieur des fichiers de diffusion.

Les formats de fichiers numériques recommandés dans ces spécifications (TIFF, JFIF, JPEG 2000 et PDF) ont été retenus en raison de leur normalisation publique ou de fait, de leur usage généralisé et des avantages qu'ils procurent à l'exploitation (couverture large des documents concernés, optimisation du poids, type de compression...). Le choix du format pour les fichiers de conservation a été en principe le suivant :

  • le format TIFF pour la numérisation noir et blanc (2 bits) ; un format PNG peut le remplacer avantageusement à cause de son universalité de lecture.

  • le format JFIF/JPEG faiblement compressé pour la numérisation niveaux de gris ou couleur, pour les manuscrits, dactylographies, registres, le rapport qualité/poids étant dans ces cas meilleur ;

  • le format TIFF (24 à 48 bits) pour la numérisation couleur, pour les documents cartographiques, iconographiques ainsi que les photographies en raison du degré de précision supérieur ; le format PNG là aussi peut être utilisé, surtout lorsqu'on veut détourer les cartes postales.

  • le format JPEG 2000 semble offrir les avantages du JFIF en terme de poids et du TIFF en terme de qualité lorsqu'il est « sans pertes de données ». Il est cependant d'un usage moins répandu. Il est par conséquent parfois proposé, mais seulement comme alternative avec un autre format. Le format JPEG 2000 est particulièrement adapté aux contenus complexes (conjuguant images et textes, comme par exemple la presse) en raison de sa technologie (compression par ondelettes qui sait distinguer les différentes couches des documents). Ce format peut être encapsulé dans des documents PDF, il devient ainsi « transparent » pour le lecteur de l'utilisateur. Lorsqu'on souhaite produire un fichier rassemblant plusieurs images, par exemple plusieurs pages d'un registre, on utilisera le format PDF/A .

Les formats de fichiers image proposés sont capables de contenir des métadonnées encapsulées, à incorporer au choix de l'utilisateur. Certains champs des métadonnées (taille d'image, résolution, date...) sont automatiquement remplis par les machines de numérisation et les appareils photographiques et demeurent exploitables tant que l'image n'a pas été l'objet d'un copier-coller.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimerRéalisé avec Scenari (nouvelle fenêtre)