<message>Dieser Text wird ebenfalls analysiert</message>
Der Parser tut dies, weil XML-Elemente andere Elemente enthalten können, wie in diesem Beispiel, wo das <name>-Element zwei weitere Elemente (erstes und letztes) enthält:
<name><first>Bill</first><last>Gates</last></name>
Und der Parser wird es wie folgt in Unterelemente aufteilen:
<name><first>Bill</first><last>Gates</last></name>
Geparste Zeichendaten (PCDATA) ist ein Begriff für Textdaten, die von einem XML-Parser analysiert werden.
Der Begriff CDATA bezeichnet Textdaten, die nicht von XML-Parsern analysiert werden sollten.
Zeichen wie „<“ und „&“ sind in XML-Elementen unzulässig.
„<“ erzeugt einen Fehler, da der Parser dieses Zeichen als Anfang eines neuen Elements interpretiert.
„&“ erzeugt einen Fehler, da der Parser dieses Zeichen als Anfang einer Zeichenentität interpretiert.
Manche Texte, wie zum Beispiel JavaScript-Code, enthalten eine große Anzahl von „<“- oder „&“-Zeichen. Um Fehler zu vermeiden, kann der Skriptcode als CDATA definiert werden.
Alles im CDATA-Abschnitt wird vom Parser ignoriert.
Der CDATA-Teil beginnt mit „ <![CDATA[ „ und endet mit „ ]]> „:
<script><![CDATA[function matchwo(a,b){if (a < b && a < 0) then{return 1;}else{return 0;}}]]></script>
Im obigen Beispiel ignoriert der Parser alles im CDATA-Abschnitt.
Hinweise zum CDATA-Abschnitt:
Der CDATA-Abschnitt darf die Zeichenfolge „]]>“ nicht enthalten. Auch verschachtelte CDATA-Abschnitte sind nicht zulässig.
Das „]]>“, das das Ende des CDATA-Abschnitts markiert, darf keine Leerzeichen oder Zeilenumbrüche enthalten.
Die Kommentare im CDATA-Abschnitt oben sind die Regeln von XML CDATA, die Sie befolgen müssen!
Im nächsten Abschnitt erklären wir die XML-Kodierung.