2.4.1. Le thésaurus
Le thésaurus est évidemment l'outil le plus complexe à élaborer. Il s'applique généralement à un domaine précis.
Exemple :
Le thésaurus des Archives de France s'applique à tous les fonds d'archives locales, publiques et privées, anciennes, modernes et contemporaines.
Il doit contenir tous les termes nécessaires à l’indexation dans le domaine qui est le sien. Il doit être complet dès sa création.
Il doit comporter un certain nombre de non-descripteurs, des termes qui ont été écartés mais qui, parce qu’il représentent des notions susceptibles de faire l’objet régulier d’interrogations, doivent être renvoyés sur le descripteur autorisé. C’est ce qu’on appelle la relation d’équivalence.
Exemple :
Dans le thésaurus français, on a écarté "marée noire” au profit de “pollution de la mer”, plus général, mais “marée noire” a été reconnue comme notion assez importante pour justifier qu'elle soit mentionnée, même si c'est pour la renvoyer sur “pollution de la mer”.
Tous les termes d'un thésaurus doivent être mis en relation hiérarchique, c'est-à-dire organisés en chapitre, rubriques et sous-rubriques. Cela est très important pour obtenir une réponse complète. C'est là que réside la grande richesse du thésaurus.
Exemple :
D'après le thésaurus W des Archives de France :
ÉQUIPEMENT | niveau hiérarchique n° 1 |
ENVIRONNEMENT | niveau hiérarchique n° 2 |
| niveau hiérarchique n° 3 |
| niveau hiérarchique n° 4 |
Interroger à “site” donne des réponses. Mais interroger à “protection de la nature” donne aussi des réponses, de niveau plus général, sur les sites ; interroger “environnement” donne encore des réponses de niveau supérieur sur les sites. Si on veut faire une recherche vraiment complète sur les sites, il faut interroger toute la hiérarchie.
En sens inverse, la hiérarchie indique qu’une recherche sur la protection de la nature doit intégrer aussi des descripteurs de niveau inférieur.
Si le fichier est manuel, le lecteur ayant le thesaurus à sa disposition pourra de lui-même faire toutes les interrogations utiles.
Dans une base de données ayant intégré le thesaurus, s’il fait une interrogation à “site”, le système demandera s’il veut aussi les termes en hiérarchie ; s’il fait une interrogation à “protection de la nature”, les réponses seront les cotes indexées à “protection de la nature” mais aussi toutes celles indexées aux termes placés hiérarchiquement en dessous, dont “site”.
Les relations hiérarchiques et les relations d’équivalence ne peuvent être établies qu’une seule fois pour un terme.
Un système informatique n’accepte pas qu’un terme soit présent dans plusieurs chaînes hiérarchiques, ni qu’un non-descripteur renvoie sur plusieurs descripteurs. On compense cette contrainte par des relations d’association.
Exemple :
Dans le thésaurus des Archives de France, la plupart des descripteurs se rapportant aux établissements d’enseignement se trouvent dans une hiérarchie « Education » (chapitre 5).
Mais les universités populaires, elles, se trouvent dans une hiérarchie « Temps libre et sociabilité » (chapitre 11).
Puisqu’il n’est pas possible de faire dépendre « université populaire » des deux hiérarchies, on fait une association.
« Université populaire » est citée comme terme associé dans la hiérarchie « Enseignement » et « Université » est un terme associé à « Université populaire » dans la hiérarchie « Éducation ».
Complément : Pour plus de détails...
Le thésaurus sert ainsi essentiellement pour les noms communs qui qualifient l'objet des documents, concepts qu'on peut ranger méthodiquement et hiérarchiser.
Complément : Pour plus de détails...
Pour en savoir plus : un exemple de thésaurus comme outil d’aide à la recherche : le site des Archives départementales de la Vendée.
Les Archives départementales de la Vendée ont élaboré en interne des référentiels destinés à guider l’internaute dans ses recherches, dans le cadre du développement, par un prestataire, d’une nouvelle interface de consultation et d’interrogation des descriptions archivistiques.
Le thésaurus Matières a été constitué a posteriori, à partir des termes figurant dans les instruments de recherche. L'architecture du thésaurus est proche du système Dewey, mais ce sont les renvois et les synonymies qui importent le plus au lecteur. Sur le site des Archives départementales, l'utilisateur peut donc sélectionner des termes à partir de plusieurs listes hiérarchisées : périodes historiques (certaines périodes sont découpées en séries d'années, par exemple, la Révolution), noms de lieux, typologie documentaire (forme littéraire, type de pièce, type de publication) et mots matières. Il est également possible d'interroger dans les mots de l'analyse. Toutefois, il ne peut y avoir de recherche qu'au même niveau, car il n'y a pas d'héritage de l'indexation.