<message>Ce texte est également analysé</message>
L'analyseur fait cela car les éléments XML peuvent contenir d'autres éléments, comme dans cet exemple, où l'élément <name> contient deux autres éléments (premier et dernier) :
<name><first>Bill</first><last>Gates</last></name>
Et l'analyseur le divisera en sous-éléments comme ceci :
<name><first>Bill</first><last>Gates</last></name>
Les données de caractères analysées (PCDATA) sont un terme utilisé pour les données texte analysées par un analyseur XML.
Le terme CDATA désigne des données texte qui ne doivent pas être analysées par les analyseurs XML.
Les caractères comme « < » et « & » sont illégaux dans les éléments XML.
"<" générera une erreur car l'analyseur interprétera ce caractère comme le début d'un nouvel élément.
"&" générera une erreur car l'analyseur interprétera ce caractère comme le début d'une entité de caractère.
Certains textes, comme le code JavaScript, contiennent un grand nombre de caractères « < » ou « & ». Pour éviter les erreurs, le code du script peut être défini comme CDATA.
Tout ce qui se trouve dans la section CDATA est ignoré par l'analyseur.
La partie CDATA commence par " <![CDATA[ " et se termine par " ]]> " :
<script><![CDATA[function matchwo(a,b){if (a < b && a < 0) then{return 1;}else{return 0;}}]]></script>
Dans l'exemple ci-dessus, l'analyseur ignore tout ce qui se trouve dans la section CDATA.
Notes sur la section CDATA :
La section CDATA ne peut pas contenir la chaîne "]]>". Les sections CDATA imbriquées ne sont pas non plus autorisées.
Le "]]>" marquant la fin de la section CDATA ne peut pas contenir d'espaces ou de nouvelles lignes.
Les commentaires dans la section CDATA ci-dessus sont les règles de XML CDATA que vous devez suivre !
Dans la section suivante, nous expliquerons le codage XML.