Section 7 - Formats de représentation de l'information

Chapitre 2. Éléments de terminologie

La terminologie du domaine n’est pas amusante en soi. Il est cependant tout à fait indispensable d’être précis sur les différents termes que nous allons utiliser dans cette partie.

Un format[1], dans son sens le plus général, permet de définir les caractéristiques physiques ou logiques d’un support d’information. Les formats sont le plus souvent normalisés ou standardisés.

Le format peut définir :

  • soit le support physique, on parlera alors de format de support ;

dans ce cas, il précisera les caractéristiques physiques de ce support : A4 est un format papier de dimensions 21cm x 29.7 cm,

  • soit les caractéristiques logiques d'organisation de l'information, nous parlerons alors de format de données et c’est cela qui nous intéresse ici,

  • soit l'ensemble des caractéristiques physiques et logiques qui peuvent être imbriquées (VHS, CD-Photo Kodak), situation peu propice à la pérennisation.

Nous verrons dans ce cours, toute une série d’exemples concrets sur les formats.

Le format va posséder de multiples caractéristiques. Certaines d’entres elles sont essentielles pour savoir si le format sera recevable ou non dans une perspective d’archivage numérique :

  • Format fermé : un format fermé a une structure non documentée et a priori inconnue hors de ceux qui l’ont défini.

  • Format normalisé : un format sera dit normalisé s'il est conforme à une norme émanant d'un organisme de normalisation (ISO, AFNOR…).

Attention : une norme décrivant un format de données peut n’être qu’un conteneur à l'intérieur duquel doivent être insérés des éléments qui peuvent ou non être normalisés, voire privés.

  • Format propriétaire : c'est un format défini par une entreprise ou un propriétaire privé qui dispose des droits de propriété intellectuelle ou du copyright correspondant (par exemple PDF, TIFF, GIF…) ;

Deux cas de figure peuvent se présenter :

le format propriétaire a été publié : dans ce cas, son propriétaire a précisé les usages qui étaient autorisés,

le format propriétaire n'a pas été publié (par exemple les fichiers produits par Microsoft Word 97).

  • Format maison ou format projet : c’est un format de données défini spécifiquement par une application maison ou par un projet au sein d’une entreprise.

  • Format publié : il s'agit d'un format dont les spécifications sont publiées et accessibles à tous sans restriction ; cela ne signifie pas que l'usage de ce format puisse se faire sans restriction.

  • Format ouvert : format publié et libre de droit, sans restriction d’usage et de mise en œuvre ; c’est le cas des formats définis par le consortium W3C (par exemple HTML, PNG).

  • Format standardisé : un format sera dit standardisé s'il est conforme à un standard

  1. Format de données, ou format de fichier ou format de représentation de l'information :

    le format de données peut être défini par l'ensemble des règles et algorithmes permettant d'organiser l'information dans un objet numérique.

    Par exemple, le format de données permettra de :

    • spécifier le codage des couleurs des pixels d'une image, définir un algorithme de compression des données et l'organisation de ces données dans un fichier (formats PNG, TIFF…),

    • spécifier l'organisation et la structuration d'informations textuelles à partir de l'encodage élémentaire des caractères (formats SGML, XML) ;

    en réalité, SGML et XML sont en premier lieu des langages comportant un ensemble de règles, une syntaxe, des mots clés permettant de constituer des documents structurés ; lorsqu'un document a été structuré par le langage XML, on connaît en pratique l'ensemble des règles d'organisation de l'information au sein de ce document ; à ce titre, XML (comme SGML) peut donc être considéré comme un format,

    • définir comment les quatre informations élémentaires que sont la mantisse (nombre entier positif), l'exposant (nombre entier positif), le signe de l'exposant et le signe de la mantisse (caractères + et -) sont organisées pour représenter un nombre réel sous forme numérique (cf. standard ANSI/IEEE 754-1985).

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimerRéalisé avec Scenari (nouvelle fenêtre)