3.2. La préservation à long terme des messages électroniques présente plusieurs difficultés

Malgré un caractère relativement rudimentaire, les messages électroniques présentent plusieurs difficultés de conservation.

Les principales ne sont pas d’ordre technique mais d’ordre archivistique...

  • Les messages électroniques véhiculent indifféremment contenus professionnels et contenus personnels, y compris de nombreuses données à caractère personnel, dans le corps du message comme dans les pièces jointes. Les messages électroniques sont donc couverts par le secret des correspondances et ne peuvent être pris en charge et gérés sans encadrement juridique ;

  • L’identification des messages à prendre en charge, à quel moment, pour quelle finalité, est capitale ;

  • L’organisation retenue pour les messageries diffère grandement en fonction des utilisateurs .

... mais il existe également des contraintes techniques

  • les messages sont tout d’abord stockés par les logiciels de messagerie et exportés de leur environnement d’origine. Si des exports unitaires au format EML sont possibles, la plupart des exports possibles se font sous forme de lots. Deux grands types de conteneurs existent :

    • les conteneurs au format PST générés par le logiciel Outlook de la société Microsoft, qui embarquent messages, mais aussi agendas, tâches et carnets d’adresses, pour tout ou partie d’une messagerie. La structuration de ces conteneurs est définie par Microsoft et évolue dans le temps, rendant toute rétrocompatibilité difficile – les versions actuelles d’Outlook prennent difficilement en charge des exports effectués depuis plus de 5 ans ;

    • les conteneurs au format MBOX, chaque fichier MBOX contenant un dossier de messages avec des pièces jointes intégrées sous forme de texte codé. Là encore, plusieurs variantes de ce format existent qui ne sont pas entièrement compatibles entre elles ;

  • les messages peuvent comprendre des liens vers des ressources qui leur sont extérieures (adresse d’un site internet par exemple) et qui peuvent être cassés suite à la disparition de la ressource ou à son changement de localisation ;

  • les pièces jointes correspondent à des fichiers enregistrés dans tous les types de formats possibles. Leur préservation à long terme peut impliquer de mettre en œuvre des stratégies spécifiques ;

  • la destruction d’un message au sein d’un fil de conversation peut provoquer une perte d’intelligibilité de la chaîne ;

  • la taille des messageries peut constituer un frein lors des opérations d’export et d’import.