4.2. La préservation à long terme des bases de données présente plusieurs difficultés
Fondamental :
Avant toute chose, il convient de signaler que la préservation de la base de données n’est pas nécessairement une fin en soi.
Tout va dépendre :
du contenu que l’on souhaite archiver,
de la finalité de cet archivage,
des besoins d’accès ultérieurs aux contenus archivés.
Avant d’entamer toute opération d’archivage d’une base de données, il convient de s’interroger sur ces points absolument essentiels.
Les difficultés de préservation peuvent être d’ordre archivistique...
les contenus manipulés dans des bases de données et à archiver peuvent prendre la forme d’agrégats plus ou moins complexes, avec des données réparties dans plusieurs tables d’une même base de données voire entre plusieurs bases de données ;
les données saisies dans les bases de données peuvent faire l’objet de mise à jour avec suppression des données antérieures ;
le degré de qualité des données saisies peut être très inégal, notamment quand leur création est décentralisée et mise entre les mains de nombreux utilisateurs ;
la connexion des utilisateurs, la mise en œuvre des processus de travail (création, modification, lecture et suppression des données) font systématiquement l’objet d’enregistrements sous forme de journaux ou de logs. Leur intégration au contenu à archiver doit être interrogée, notamment s’il est essentiel de garantir l’authenticité des données ;
préserver les méthodes de travail et l’apparence des interfaces utilisées par les usagers de la base peut mériter d’être examiné
... ou d'ordre technique
l’architecture des bases de données peut être très complexe (nombre de tables par exemple) ;
l’architecture des bases de données et la manière dont les données sont codées à l’intérieur de la base ne sont pas toujours bien documentées. Même si une documentation existe, elle peut avoir été établie au moment de la création de la base et ne pas refléter les évolutions fonctionnelles et techniques de celle-ci. Or une bonne documentation est capitale pour garantir un accès sur le long terme aux contenus eux-mêmes ;
les bases de données peuvent comprendre des liens vers des ressources qui leur sont extérieures (adresse d’un site web par exemple) et qui peuvent être cassés suite à la disparition de la ressource ou à son changement de localisation ;
d’autres documents d’archives sous format numérique se présentant sous la forme de fichiers indépendants, stockés à part de la base de données, mais intimement liés aux documents présents dans la base (ex. pièces justificatives). Leur export combiné à celui des données enregistrées en base peut se révéler problématique.