Module 9 - Section 2 : Numériser les documents

A. Les propriétés des formats d'enregistrement

Les propriétés des formats d'enregistrement

le chapitre traite des formats d'enregistrement, ils ont un rôle essentiel dans le produit fini. Actuellement, il n'y a plus de machines de numérisation à performances médiocres, ce n'est que le format d'enregistrement qui décide de la conservation de la qualité du produit.

Définition

Dans les pages qui vont suivre, et déjà au début de ce chapitre, des termes nouveaux apparaissent et pourraient mettre le lecteur en difficulté. Mettons donc à plat ces termes pour bien comprendre le contenu des différents formats d'enregistrement.

Le format d'enregistrement

Le format d'enregistrement est l'ensemble des caractéristiques du fichier qui lui permettent d'être reconnus par les applications. La manière d'écrire le début et la fin de fichier selon certains codes déclenche le fonctionnement adéquat de l'application qui lit ou transforme ce fichier. Il existe des formats « propriétaires » dont les codes sont typiques à un éditeur, et des formats « universels » ou « libres » dont les codes sont divulgués publiquement. Nous les choisirons pour cette raison.

Le fichier maître (destiné à l'archivage permanent)

C'est le premier fichier enregistré sans perte de données et qui contient tout ce qui est nécessaire à la conservation de l'archive numérique et à la génération des sous-fichiers de diffusion: image, corrections et métadonnées.

  • L'image est l'objet informatique résultant de l'acquisition brute par le numériseur.

  • Les corrections sont des réglages de densité de l'image, de colorimétrie par exemple dans le cas de la restauration de diapos aux couleurs dégradées par le temps. Les corrections sont temporaires pendant la durée de post-production, puis appliquées de façon permanente après contrôle par un expert.

  • Les métadonnées sont les textes au format XML introduits dans le fichier image. Elles n'apparaissent pas sur l'image, mais dans les éditeurs de métadonnées ou les légendes automatiques de certains environnements. Dans le cas d'une image restaurée, ces métadonnées signalent le fait de la restauration.

Le fichier de diffusion ou d'exploitation

La caractéristique principale de ce fichier est la portabilité (taille réduite pour diffusion en réseau). L'on cherchera toujours le format le plus efficace pour cette fonction. Le PDF (portable document format) est très avantageux, il permet d'assembler plusieurs pages d'images avec un descriptif ne nécessitant pas d'application spécifique à la lecture des métadonnées

Le calque

Le calque est une image ou une correction se superposant à d'autres calques dans un même fichier image. Lorsque l'on veut obtenir une image « plate » définitive, tous les calques sont fusionnés (confondus en un seul). Certains formats enregistrent les calques, d'autres pas.

Calque de réglage

Un logiciel de retouche photo peut générer des calques de réglage d'image pour changer les caractéristiques de densité, de contraste, de colorimétrie... de l'image placée en-dessous. Un fichier enregistré avec ces calques permet le changement de ces valeurs à l'infini, sans altérer l'image originale qui est la à base du fichier.

La couche Alpha

La couche alpha est une série de pixels transparents juxtaposés à des pixels colorés d'opacité 100%. Dans le format GIF, cela permet de détacher des objets sur un fond coloré dans une page internet. La limite est brutale, et le contour présente un aspect crénelé.

La transparence

La transparence permet d'enregistrer des parties d'images dont l'opacité n'est pas 100%. Il y a peu d'application de la transparence en archives, mais lors du détourage d'une carte postale par exemple, cela permet de ne pas avoir des bords crénelés comme pour la couche alpha, le bord est progressivement transparent sur 2 ou 3 pixels.

La compression

C'est l'action qui consiste à réduire la taille du fichier enregistré par un codage spécifique à chaque algorithme de compression. La compression peut se faire avec ou sans pertes de données. Une compression sans pertes de données réduit la taille de 20 à 30% et jusqu'à 50% pour la plus performante. La compression avec perte de données peut réduire la taille de 95%.

L'algorithme

C'est le modèle mathématique qui permet à l'ordinateur de réaliser la réduction du nombre de données à enregistrer sur le disque. Tous les blancs et fins de ligne sont supprimés dans le fichier encodé qui a l'aspect d'un bloc en continu constitué de signes incompréhensibles. On n'y reconnaît même pas les textes des métadonnées...

La perte de données

Un terme un peu choquant prend place dans notre propos : la compression avec perte de données. Ce procédé consiste à réduire l'échantillonnage des couleurs, c'est à dire le nombre de couleurs contenues dans l'image, mais pas le nombre de pixels. Il en résulte une taille réduite du fichier enregistré et des artefacts visibles lors d'une compression importante. C'est un procédé lié à un format développé par le Joined Photographs Expert Group (JPEG). Les métadonnées ne sont pas perdues lors de la compression du fichier.

Attention

En aucun cas les formats engendrant des pertes de données ne doivent être utilisés pour assurer la copie de sauvegarde d'archives en voie de détérioration physique.

Les métadonnées

Les métadonnées sont des textes qui sont insérés au fichier image, mais qui n'apparaissent pas visuellement sur celle-ci. Les métadonnées sont enregistrées au format d'échange XML et prennent les aspects que le lecteur de métadonnées leur donne. Les métadonnées sont distribuées dans des champs reconnus par des normes internationales dont le standard le plus connu est IPTC, créé à l'origine pour les photographes de presse internationale. Les appareils de numérisation complètent automatiquement les champs de métadonnées EXIF qui décrivent les conditions de prises de vues

La production

C'est la phase où l'on capture l'image de l'original et qu'on l'enregistre une première fois en vue de la suite des opérations.

La post–production

Cette phase comprend toutes les opérations de traitement d'images et d'insertion de métadonnées. A l'issue de ces opérations, le fichier maître est constitué avec un enregistrement sans pertes de données.

Le stockage

Le fichier maître constituera une archive permanente. Mais au cours de son existence en centre d'archives, les supports physiques vont évoluer. Pour pallier leur obsolescence, il faudra régénérer les fichiers en les recopiant sur de nouveaux supports (Disques optiques, serveurs sécurisés, disques durs, bandes magnétiques...)

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimerRéalisé avec Scenari (nouvelle fenêtre)