2.3.2. La préservation à long terme des fichiers PDF présente plusieurs difficultés
Très répandus, les fichiers PDF présentent pourtant de nombreuses difficultés de préservation :
la norme PDF étant relativement complexe, elle est souvent interprétée différemment par les éditeurs de logiciels. Les logiciels de visualisation des fichiers PDF sont ainsi particulièrement permissifs aux non-conformités par rapport à la norme ;
la création de fichiers PDF par numérisation de documents d’archives sur support physique n’est pas nécessairement associée à un processus de contrôle de la qualité visuelle comme technique des fichiers produits. C’est tout particulièrement le cas des numérisations « à la volée », à partir de scanners et d’imprimantes/copieurs multifonctions ;
la création et la transmission de fichiers PDF peuvent conduire à la compression avec perte des informations, voire au chiffrement de celles-ci ;
selon la version du format PDF choisie, certains éléments du document et de sa mise en forme (police de caractère, images, ressources multimédias) ne seront pas intégrés dans le fichier au moment de sa création ;
a contrario, du fait que le format PDF – hors version PDF/A – permet d’intégrer tout type de contenus, les fichiers PDF peuvent inclure des contenus susceptibles de mettre en danger un système d’archivage : fonctions JavaScript, programme malveillant, etc. ;
les fichiers PDF sont en réalité facilement modifiables ;
Comme tout format conteneur, un fichier PDF est à la fois un tout et une somme de parties ayant chacune ses propres contraintes en matière de préservation.
Attention :
Le format PDF dans sa version PDF/A a longtemps été recommandé pour la préservation de tous les documents d’archives sur support numérique.
Or cette solution n’est pas viable, pour plusieurs raisons :
la migration au format PDF prend du temps et est consommatrice de ressources (humaines, financières, techniques). Elle n’est donc pas toujours rentable ;
la migration au format PDF n’est pas adaptée à certains types de formats de fichiers : présentations intégrant des animations (l’impression au format PDF/A supprime celles-ci), tableurs (l’impression ne prend pas en compte la multiplicité des onglets). Ce problème est exacerbé lorsque l’utilisateur souhaite réutiliser les données imprimées (ex. coordonnées mathématiques utilisés dans les formats de fichiers de dessin, données enregistrées dans une base de données) ;
comme les autres versions du format PDF, la version PDF/A est normalisée d’une manière sujette à interprétations. Il est donc quasiment impossible de disposer de fichiers PDF/A strictement conformes à la norme elle-même.