Les documents XML forment une structure arborescente qui commence à la « racine » et s'étend jusqu'aux « feuilles ».
La structure arborescente est communément appelée arborescence XML et peut facilement décrire n'importe quel document XML.
En utilisant une arborescence, vous pouvez connaître toutes les branches et sous-branches suivantes en commençant par la racine.
Les documents XML utilisent une syntaxe simple et auto-descriptive :
<?xml version="1.0" encoding="ISO-8859-1"?><note><to>Tove</to><from>Jani</from><heading>Rappel</heading><body>Don ne m'oublie pas ce week-end !</body></note>
La première ligne est la déclaration XML. Il définit la version de XML (1.0) et l'encodage utilisé (ISO-8859-1 = Latin-1/jeu de caractères d'Europe occidentale).
La ligne suivante décrit l'élément racine du document (comme dire : "Ce document est un pense-bête") :
<remarque>
Les quatre lignes suivantes décrivent les quatre éléments enfants de la racine (vers, depuis, titre et corps) :
<to>Tove</to><from>Jani</from><heading>Rappel</heading><body>Ne m'oubliez pas ce week-end !</body>
La dernière ligne définit la fin de l'élément racine :</note>Vous pouvez supposer à partir de cet exemple que le document XML contient une note de Jani à Tove. XML est extrêmement auto-descriptif, n'est-ce pas ? Les documents XML forment une structure arborescente. Les documents XML doivent contenir un élément racine. Cet élément est l'élément parent de tous les autres éléments. Les éléments d'un document XML forment une arborescence de documents. L'arbre commence à la racine et s'étend jusqu'au bas de l'arbre. Tous les éléments peuvent avoir des éléments enfants :
<root><enfant><sous-enfant>....</subchild></child></root>
Des termes tels que parent, enfant et frère ou sœur sont utilisés pour décrire la relation entre les éléments. Les éléments parents possèdent des éléments enfants. Les éléments enfants de même niveau deviennent frères et sœurs (frères ou sœurs). Tous les éléments peuvent avoir du contenu textuel et des attributs (similaires au HTML). Exemple : L'image ci-dessus représente un livre au format XML suivant :
<librairie><bookcategory="COOKING"><title lang="fr">Italien de tous les jours</title><author>Giada De Laurentiis</author><année>2005</année><prix>30,00</price ></book><bookcategory="ENFANTS"><title lang="fr">Harry Potter</title><author>J K. Rowling</author><année>2005</année><prix>29,99</price></book><bookcategory="WEB"><title lang="fr">Apprendre XML</title><author> Erik T. Ray</auteur><année>2003</année><prix>39,95</prix></book></librairie>
L'élément racine dans l'exemple est <bookstore>. Tous les éléments <book> du document sont contenus dans <bookstore>. L'élément <book> a 4 éléments enfants : <title>, <author>, <year>, <price>. Dans la section suivante, nous expliquerons la syntaxe de XML.