4.1. Substrat technique
SGML, XML, HTML sont des langages créés pour des usages différents. Ils sont tous utilisés pour caractériser les éléments d’information diffusés sur Internet. Usages :
Version allégée du SGML (Langage normalisé de balisage généralisé), le XML (Langage de balisage extensible) est un langage ouvert qui permet de créer ses propres balises.
Alors que le HTML s’attache à la présentation d’un contenu, XML porte sur la description de ce contenu.
Tout document XML est un arbre d’éléments, permettant de décomposer le texte en unités d’informations. L’arbre d’éléments est formé d’un et d’un seul élément racine qui contient tous les autres éléments.
Les éléments :
sont définis par des balises de début de contenu < > et de fin de contenu </ > ;
ont un code donné entre les chevrons identifié avec un nom en clair; ex. : <nm> pour nom ;
peuvent contenir :
directement du texte,
d’autres éléments (éléments englobants),
des liens vers des ressources électroniques externes ou internes au document (éléments de lien),
peuvent être qualifiés par des attributs qui en en modifient le sens.
Exemple :
Dans le cas présenté ci-dessous, nous avons un élément balise qui contient deux attributs :
un premier nommé attribut1 dont la valeur est valeur1
un deuxième nommé attribut2 dont la valeur est valeur2.
Le caractère "=" sépare le nom et la valeur, les guillemets délimitent la valeur et un espace sépare les attributs entre eux.
<balise attribut1="valeur1" attribut2="valeur2">...</balise> |
La structure en arborescence d’un document XML peut être déclarée dans le corps du document XML ou dans un fichier à part :
cette déclaration ou Définition de Type de Document (DTD) est facultative ;
son avantage est de faire partager à une communauté d’utilisateurs une même structuration de l’information.