4.2 - Un exemple de métadonnées descriptives : le format Dublin Core
Le Dublin Core est un schéma de métadonnées générique et simple. Initialement, il s'appuyait sur 15 éléments de description formels (titre, auteur, éditeur), intellectuels (sujet, description, langue...) et relatifs à la propriété intellectuelle. Cet ensemble historique, créé en 1995, constitue le « Dublin Core Metadata Element Set ».
Il s'est enrichi d'éléments complémentaires : des relations (isPartOf, isVersionOf, isFormatOf, etc.), des référentiels complémentaires avec la liste des types permettant de caractériser plus finement la syntaxe de tel ou tel élément (DC: type). L'ensemble constituant avec les éléments d'origine, les « DCMI Metadata Terms ». Ce format est maintenu par le « Dublin Core Metadata Initiative » qui est une organisation constituée de membres émanant principalement de bibliothèques nationales et universitaires. Le Dublin Core est devenu la norme ISO 15836 en 2003.
Exemple : Un exemple de métadonnées Dublin Core pour la description d'un corpus oral
Nous présentions ci-après le code XML commenté du fichier de métadonnées puis sa représentation à des fins de consultation par les utilisateurs :
La langue par défaut étant l’anglais, si le contenu d’une balise est exprimée dans une autre langue, cela est indiqué par l’ajout d’un attribut :lang (cf. :title)
Les deux espaces de noms et correspondent respectivement aux 15 étiquettes de la norme ISO 15836 (Dublin Core) et pour aux « refinements et encoding » définis par le DCMI.
L’espace de nom OLAC est celui de l’organisation de même nom (Open Language Archives Community).
Les commentaires sont en italiques.
<!-- titres -->
<dc:title xml:lang="fr">L'arrivée à Marseille</dc:title>
<dcterms:alternative xml:lang="lad">La vinida a Marseya</dcterms:alternative>
<!-- durée du corpus en heures minutes secondes … -->
<dcterms:extent xsi:type="crdo:Duration">PT01M30S</dcterms:extent
<!—L’objet d’étude est le Judéo-espagnol (lad en ISO-639-3) -->
<dc:subject olac:code="lad" xsi:type="olac:language">Judéo-espagnol</dc:subject>
<!-- La ressource contient du Judéo-espagnol (lad en ISO-639-3) -->
<dc:language olac:code="lad" xsi:type="olac:language"/>
<!-- portée du contenu objet d’étude de la ressource --> <dc:coverage xml:lang="fr">Langue traditionnellement parlée dans l'ex-Empire ottoman. Variante de Salonique (Grèce).</dc:coverage>
<!-- classement suivant des typologies et des vocabulaires contrôlés proposés par OLAC -->
<dc:subject olac:code="text_and_corpus_linguistics" xsi:type="olac:linguistic-field"/>
<dc:type olac:code="dialogue" xsi:type="olac:discourse-type"/>
<dc:type olac:code="primary_text" xsi:type="olac:linguistic-type"/>
<!-- Identification du lieu de l’enquête : verbeuse pour l’humain, identifiant du Thesaurus of Geographic Names + longitude/lattitude dans une syntaxe proposé par DCMI -->
<dcterms:spatial xml :lang="fr">France, Bouches-du-Rhône, Aubagne.</dcterms:spatial>
<dcterms:spatial xsi:type="dcterms:TGN">1031883</dcterms:spatial>
<dcterms:spatial xsi:type="dcterms:Point">east=5.5833; north=43.2833</dcterms:spatial>
<!-- date d’enregistrement -->
<dcterms:created xsi:type="dcterms:W3CDTF">2005-02-27</dcterms:created>
<!-- éditeur, laboratoire de rattachement du responsable de la ressource -->
<dc:publisher>CNRS / LMS</dc:publisher>
<!-- participants à la création de la ressource avec leur rôle (vocabulaire contrôlé OLAC). Certains participants ont été anonymisés -->
<dc:contributor olac:code="depositor" xsi:type="olac:role">Mavrogiannis, Pandelis</dc:contributor>
<dc:contributor olac:code="speaker" xsi:type="olac:role">P S, I</dc:contributor>
<dc:contributor olac:code="participant" xsi:type="olac:role">M, R Y</dc:contributor>
<dc:contributor olac:code="participant" xsi:type="olac:role">D H, A A</dc:contributor>
<dc:contributor olac:code="participant" xsi:type="olac:role">Quatrième, Locuteur</dc:contributor>
<dc:contributor olac:code="interviewer" xsi:type="olac:role">Mavrogiannis, Pandelis</dc:contributor>
<dc:contributor olac:code="researcher" xsi:type="olac:role">Mavrogiannis, Pandelis</dc:contributor>
<dc:contributor olac:code="compiler" xsi:type="olac:role">Varol, Marie-Christine</dc:contributor>
<!-- Type mime de la ressource et type DCMIType (vocabulaire contrôlé) -->
<dc:format xsi:type="dcterms:IMT">audio/x-wav</dc:format>
<dc:type xsi:type="dcterms:DCMIType">Sound</dc:type>
<!-- réafirmation du copyright et cession de droits par la licence CC + indication des moyens d’accès à la ressource -->
<dc:rights>Copyright (c) Mavrogiannis, Pandelis</dc:rights>
<dcterms:accessRights>Freely available for non-commercial use</dcterms:accessRights>
<dcterms:license xsi:type="dcterms:URI">http://creativecommons.org/licenses/by-nc-nd/2.5/</dcterms:license>
<!-- La ressource est un extrait d’une ressource plus vaste -->
<dcterms:isPartOf xsi:type="dcterms:URI">oai:crdo.vjf.cnrs.fr:crdo-LAD_INT3</dcterms:isPartOf>
<!-- La ressource est requise pour la consultation d’une autre ressource qui est en fait sa transcription -->
<dcterms:isRequiredBy xsi:type="dcterms:URI">oai:crdo.vjf.cnrs.fr:crdo-LAD_EXTRAIT1_INT03</dcterms:isRequiredBy>
<!-- URL de la ressource -->
<dc:identifier xsi:type="dcterms:URI">http://crdo.risc.cnrs.fr/data/mavrogiannis/EXTRAIT1_INT03.wav</dc:identifier>
Les mêmes métadonnées présentées aux utilisateurs
