Module 6 - section 7 : Indexation

5. Conclusion

Pendant longtemps, l’indexation a été une opération menée à l’issue de l’achèvement d’un classement et avant l’impression de l’instrument de recherche sur papier. L’index était conçu seulement comme une annexe d’inventaire ou de répertoire. Il était généralement fait par une seule personne, dans un laps de temps assez restreint et sur un volume d’analyses lui aussi restreint. Il se présentait sous une forme aboutie (manuelle ou dactylographiée), relue avant impression. On y détectait donc facilement les anomalies et on les corrigeait.

Avec le développement des instruments de recherche synthétiques et la volonté croissante de disposer d’une information multiple à l’échelle d’un centre d’archives, l’indexation est devenue une opération qui vise le plus souvent la constitution de fichiers ouverts et de plus en plus volumineux, opération qui prend souvent la forme d’un travail collectif. Les défauts sont multipliés et les fichiers deviennent irrécupérables.

Ces remarques valent tout autant pour la préparation d’instruments de recherche qu’on voudra diffuser électroniquement. Bien que la prochaine section s’adresse plutôt à des usagers qui ont acquis une certaine expérience, le débutant voudra quand même en prendre connaissance pour en tenir compte éventuellement dans son travail. De moins en moins d’instruments de recherche sont publiés sur papier parce que de telles éditions coûtent très cher et prennent beaucoup de temps à réaliser. Un nombre croissant de centres préfèrent recourir à l’édition électronique sur Internet qui se fabriquent de façon plus automatiques, sont moins coûteuses et qui peuvent se corriger plus facilement, en cas d’erreur.

ComplémentPour plus de détails...

Pour en savoir plus : le web sémantique et les vocabulaires contrôlés

L’accès et l’interconnexion sémantique des collections patrimoniales est un des axes de recherche en cours. Les thèmes, sujets, concepts représentés dans les ressources sont comparables et constituent autant de points d’interconnexion pour rendre ces collections interopérables. Mais ces collections sont généralement indexées, chacune avec ses langages spécifiques. Ces derniers constituent souvent des outils hétérogènes, conçus et élaborés selon des règles d’indexation qui leur sont propres. L’hétérogénéité réside autant dans le type d’outil et son mode d’élaboration et de représentation (thésaurus, liste d’autorité) que dans les variations présentes dans la couverture sémantique de concepts comparables. Les environnements linguistiques hétérogènes se surajoutent également à cette complexité. Comment permettre à un même public d’accéder à l’ensemble des documents de deux ou plusieurs collections indexées chacune avec un vocabulaire distinct en utilisant indifféremment les termes de l’un ou de l’autre de ces vocabulaires ? Comment utiliser les termes d’un langage de représentation spécifique pour chercher dans les collections qui n’ont pas de lien direct avec ce langage ? Pour atteindre ces objectifs, les termes en question doivent être alignés et les vocabulaires concernés doivent être rendus interopérables.

Deux orientations majeures se distinguent dans les travaux en cours. L’une a trait à l’établissement manuel des équivalences entre les termes des vocabulaires différents utilisés pour les collections visées à interconnecter. L’autre, plus récente, utilise les techniques du web sémantique, partant du principe que les vocabulaires contrôlés sont de véritables systèmes d’organisation de connaissances et correspondent donc au type d’artefacts dont la conception constitue à la fois le but et le moyen de la vision du Web sémantique[1].

En d’autres termes, les techniques du Web Sémantique peuvent donner une nouvelle vie aux outils traditionnels que sont les vocabulaires contrôlés en les exploitant au moyen de technologies standards développés pour les réseaux. Les vocabulaires contrôlés se voient ainsi utilisés dans des contextes élargis de mise en relation de ressources.

  1. Web sémantique

    Le Web sémantique désigne un ensemble de technologies permettant une description approfondie et structurée des données du Web en vue d'un accès performant et global à ces données. Le Web sémantique repose notamment sur le modèle RDF (Resource Description Framework) destiné à décrire les données et leurs relations entre elles. L'intérêt du Web sémantique pour les archives réside dans la capacité à créer davantage de liens entre les descriptions archivistiques et à les rendre plus visibles sur le Web.

PrécédentPrécédentSuivantSuivant
AccueilAccueilImprimerImprimerRéalisé avec Scenari (nouvelle fenêtre)