1.1.2. La codification métier

Dans l’univers numérique, l’information peut également être codée selon des règles et conventions que nous pourrions qualifier de « métier ». 

Deux cas de figures se présentent :

  • L’utilisation d’une nomenclature reconnue nationalement ou internationalement (ex. pour la France, le Code officiel géographique ou la Nomenclature des activités françaises ou la Classification géographique type utilisée par Statistiques Canada) ;

  • La création d’une codification permettant de simplifier les données enregistrées dans les fichiers, mais dont la saisie peut être transparente pour l’utilisateur (ex. Code de sécurité sociale en France).

Prenons l’exemple d’un registre.

Lorsqu’un individu ou une organisation demandent à être enregistrés, ils doivent fournir une série d’informations précises, comme leur nom, leur prénom (ou leur raison sociale si c’est une organisation), leur date de naissance (ou leur date de création si c’est une organisation), leur adresse, etc. Les informations fournies par l’individu ou l’organisation sont complétées par l’organisation qui tient le registre, avec d’autres informations comme la date d’enregistrement, par exemple.

Dans l’univers physique, ces registres prenaient généralement la forme de volumes reliés pré-imprimés, dont les doubles-pages étaient organisées en colonnes correspondant aux différentes informations fournies par le demandeur ou rajoutées par le gestionnaire du registre. Cette organisation en colonnes reflétait la structure du registre. Généralement, sur chaque double-page, l’en-tête de chaque colonne était répété et indiquait le type d’information qui était attendu dans la colonne. Chaque enregistrement dans le registre était matérialisé par une ligne sur la double-page. Les informations écrites dans chaque colonne, pour chaque enregistrement, étaient rédigées dans un langage majoritairement intelligible - même si on y trouve des abréviations – par la ou les personnes qui tenaient le registre.

Dans l’univers numérique, on retrouve une logique similaire :

  • les registres sont structurés avec l’équivalent de « colonnes » (tout dépend de la complexité du registre) ;

  • chaque ligne correspond à un enregistrement donné.

Simplement, les informations saisies dans chaque « colonne » pour un enregistrement donné peuvent faire l’objet d’un codage complémentaire, défini au moment où celui-ci est passé d’un support physique à un support numérique. Pour rendre l’information intelligible, il faut donc décoder l’information.

Exemple

En France, l’exemple le plus simple pour illustrer cette question est celui du numéro d’immatriculation auprès de la Sécurité sociale dont dispose chaque individu, ce que l’on appelle le NIR (Numéro d’Identification au Répertoire).

Ce numéro est composé d’une série de 15 chiffres, structuré de la manière suivante (ce qui correspond aux colonnes du registre) :

  • le sexe de la personne : 1 chiffre ;

  • le millésime de l’année de naissance de la personne : 2 chiffres ;

  • le mois de naissance de la personne : 2 chiffres ;

  • le lieu de naissance de la personne : 2 chiffres pour la zone (numéro du département pour les personnes nées en France ou un code particulier pour les personnes nées à l’étranger) + 3 chiffres correspondant soit à la ville de naissance, soit au pays de naissance ;

  • un numéro d’ordre dans le mois de naissance : 3 chiffres ;

  • une clé de contrôle : 2 chiffres.

Le sexe et le lieu de naissance de la personne font l’objet d’un codage. Ainsi, le sexe de la personne peut être renseigné avec le chiffre 1 (si c’est un homme), 2 (si c’est une femme) ou 3 (si le sexe est indéterminé). 

Les deux premiers chiffres du lieu de naissance correspondent à un code donné au département de naissance. Encore plusieurs départements peuvent-ils avoir le même code, à un moment différent. Avant 1962, le code 91 correspondait au département d’Alger. Depuis 1968, au département de l’Essonne. Le code 99 correspond à tous les pays étrangers. 

Quant au code correspondant à la ville de naissance ou au pays de naissance, il est spécifique et n’est pas le même que celui utilisé par les services postaux.

Attention

Il y a donc bien un codage qu’il est important de documenter pour être en mesure de rendre l’information intelligible, quel que soit le format de fichiers utilisé pour encoder techniquement celle-ci.

D’autres cas de figure peuvent également être cités : le référentiel de localisation géographique pour une carte, les unités de mesure et l’échelle pour un plan, etc. Ces informations « métier » sont absolument nécessaires pour interpréter les informations. Encore faut-il les connaître … et les localiser.