Module 9 - Section 2 : Numériser les documents

6.6. Importance de la taille des fichiers

Si l'on fait l'inventaire des formats courants que l'on peut utiliser pour enregistrer une page manuscrite, on aboutit à un histogramme tel que celui ci-dessous.

La taille des fichiers est très importante lorsque l'on engage des numérisations en grande série. les histogrammes ci-dessous démontrent de manière percutante que:

  • Notre meilleur choix sera: le TIF bitonal en premier lieu (dans cette analyse la résolution en mode bitonal a été choisie au double de celle en niveau de gris ou en couleurs).

  • Le Jpeg en couleurs sera recommandé pour les autres cas. Le JPEG en niveau de gris sera réservé à la numérisation des microfiches si on ne peut vraiment pas les transformer en mode bitonal.

Analyse comparée des tailles de fichiers :

Un même fichier d'un document manuscrit a été converti dans tous les formats recommandés dans ce cours. La taille de départ 10 000 Kbytes, (environ 10M0) est celle du fichier Tiff en couleurs, que l'on enregistrerait pour une préservation intégrale des caractéristiques du document et sans pertes de données. Cette taille donne aussi une idée de volume d'une photothèque de fichiers maîtres (que l'on enregistre en Tiff) par rapport à une bibliothèque de documents à consulter en ligne (tous les autres formats).

tailles comparées de tous les formats

A la lecture de l'histogramme ci-dessus, on découvre une disproportion étonnante entre les modes d'enregistrement. Pour la mise en ligne, on va donc s'intéresser aux quatre derniers.

tailles comparées des fichiers de diffusion

Ce deuxième graphe montre qu'à un niveau de compression élevé (3 ou basse qualité), le jpeg a la même taille en couleur et en niveaux de gris.

L'enregistrement des fichiers au mode bitonal en TIFF est plus performant qu'en GIF.

Pour donner une illustration comparée de ces modes concurrents, proposons nous de définir les aspects des fichiers à Isotaille d'enregistrement, c'est à dire la taille réelle en pixels de fichiers ayant la même taille d'enregistrement après compression.

Aspect de fichiers de même taille

La simulation ci-dessus tient compte des caractéristiques suivantes:

  • Les fichiers couleur et niveaux de gris sont compressés en JPEG aux niveaux de qualité moyenne ou basse ( entre 3 et 5 sur 12 niveaux de qualité)

  • Dans ces conditions le fichier en niveaux de gris est juste un peu plus grand que celui en couleurs, donc pour une même taille enregistrée on aura moins de pixels (ce que montre la figure)

  • Le fichier bitonal offrira 4 fois plus de pixels pour cette taille, mais se montrera moins performant sur les textes pâles ( indication au crayon en haut de l'image)

Pour toutes ces raisons, on peut choisir des modes différents de colorimétrie pour traiter une même série d'archives : c'est le contraste des écritures qui nous guidera vers le mode adéquat.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimerRéalisé avec Scenari (nouvelle fenêtre)