Chapitre 2. Éléments de terminologie
La terminologie du domaine n’est pas amusante en soi. Il est cependant tout à fait indispensable d’être précis sur les différents termes que nous allons utiliser dans cette partie.
Un format[1], dans son sens le plus général, permet de définir les caractéristiques physiques ou logiques d’un support d’information. Les formats sont le plus souvent normalisés ou standardisés.
Le format peut définir :
soit le support physique, on parlera alors de format de support ;
dans ce cas, il précisera les caractéristiques physiques de ce support : A4 est un format papier de dimensions 21cm x 29.7 cm,
soit les caractéristiques logiques d'organisation de l'information, nous parlerons alors de format de données et c’est cela qui nous intéresse ici,
soit l'ensemble des caractéristiques physiques et logiques qui peuvent être imbriquées (VHS, CD-Photo Kodak), situation peu propice à la pérennisation.
Nous verrons dans ce cours, toute une série d’exemples concrets sur les formats.
Le format va posséder de multiples caractéristiques. Certaines d’entres elles sont essentielles pour savoir si le format sera recevable ou non dans une perspective d’archivage numérique :
Format fermé : un format fermé a une structure non documentée et a priori inconnue hors de ceux qui l’ont défini.
Format normalisé : un format sera dit normalisé s'il est conforme à une norme émanant d'un organisme de normalisation (ISO, AFNOR…).
Attention : une norme décrivant un format de données peut n’être qu’un conteneur à l'intérieur duquel doivent être insérés des éléments qui peuvent ou non être normalisés, voire privés.
Format propriétaire : c'est un format défini par une entreprise ou un propriétaire privé qui dispose des droits de propriété intellectuelle ou du copyright correspondant (par exemple PDF, TIFF, GIF…) ;
Deux cas de figure peuvent se présenter :
le format propriétaire a été publié : dans ce cas, son propriétaire a précisé les usages qui étaient autorisés,
le format propriétaire n'a pas été publié (par exemple les fichiers produits par Microsoft Word 97).
Format maison ou format projet : c’est un format de données défini spécifiquement par une application maison ou par un projet au sein d’une entreprise.
Format publié : il s'agit d'un format dont les spécifications sont publiées et accessibles à tous sans restriction ; cela ne signifie pas que l'usage de ce format puisse se faire sans restriction.
Format ouvert : format publié et libre de droit, sans restriction d’usage et de mise en œuvre ; c’est le cas des formats définis par le consortium W3C (par exemple HTML, PNG).
Format standardisé : un format sera dit standardisé s'il est conforme à un standard