2.2.1. La préservation à long terme des fichiers de tableurs
Les fichiers correspondant à des tableurs permettent de stocker des données (texte, nombre, date, pourcentage, formule de calcul, etc.) sous forme de tableaux, divisés en colonnes et en lignes. Les formats de fichiers les plus récents de cette catégorie sont en fait des formats conteneurs de type .zip intégrant de multiples fichiers (il est possible de le constater en changeant l’extension des fichiers correspondants).
La préservation à long terme des tableurs présente plusieurs difficultés
On rencontre avec ces fichiers les mêmes problématiques que celles posées par les fichiers de traitement de texte (obsolescence des logiciels de lecture, fiabilité des métadonnées embarquées, présence de données dynamiques, lien vers des ressources externes, présence de dispositifs de sécurité).
À cela s’ajoutent cependant des problèmes spécifiques :
le formatage des cellules (choix d’un type comme texte, date, nombre) est fragile, et peut facilement être cassé, ce qui peut générer des difficultés d’interprétation des données ;
plusieurs tableaux peuvent être intégrés dans un même fichier et être liés entre eux ou à des tableaux contenus dans d’autres fichiers de manière dynamique, la modification d’une valeur dans un tableau entraînant la modification des valeurs liées dans les autres tableaux (on parle alors de tableau croisé dynamique). Le simple déplacement d’un des fichiers peut occasionner la perte du lien avec les autres fichiers ;
ces fichiers peuvent contenir des équations mathématiques et des visualisations statistiques sous forme de diagrammes ou de graphiques (entre autres) qui sont difficiles à récupérer dans certains contextes (notamment quand les fichiers ont été créés à partir de logiciels de tableurs disponibles en ligne) ;
ces fichiers peuvent naturellement contenir des formules de calcul mathématiques et des macros.
Les stratégies et solutions à adopter
Les stratégies de préservation sont globalement identiques à celles mises en œuvre pour les fichiers de traitement de texte, cependant avec les particularités suivantes :
toute migration vers un format de fichiers plus simple – type CSV (Comma Separated Value) – et toute impression au format PDF risque de faire perdre certains éléments des fichiers : formules mathématiques et logiques, graphiques, diagrammes, macros, liens avec d’autres tableaux ;
l’impression au format PDF n’est pas adaptée dès lors qu’il s’agit de préserver des tableaux aux nombreuses colonnes et lignes et dont les données devront pouvoir être récupérées et ré-exploitées pour d’autres usages. Il en va de même pour les fichiers contenant plusieurs tableaux, notamment quand ils sont liés entre eux.