<message>Teks ini juga diuraikan</message>
Parser melakukan hal ini karena elemen XML dapat berisi elemen lain, seperti dalam contoh ini, di mana elemen <name> berisi dua elemen lainnya (pertama dan terakhir):
<name><first>Tagihan</first><last>Gerbang</last></name>
Dan parser akan memecahnya menjadi sub-elemen seperti ini:
<name><first>Tagihan</first><last>Gerbang</last></name>
Data karakter yang diurai (PCDATA) adalah istilah yang digunakan untuk data teks yang diurai oleh parser XML.
Istilah CDATA adalah data teks yang tidak boleh diurai oleh parser XML.
Karakter seperti "<" dan "&" ilegal dalam elemen XML.
"<" akan menghasilkan kesalahan karena parser akan menafsirkan karakter ini sebagai awal elemen baru.
"&" akan menghasilkan kesalahan karena parser akan menafsirkan karakter ini sebagai awal dari entitas karakter.
Beberapa teks, seperti kode JavaScript, berisi banyak karakter "<" atau "&". Untuk menghindari kesalahan, kode skrip dapat didefinisikan sebagai CDATA.
Segala sesuatu di bagian CDATA diabaikan oleh parser.
Bagian CDATA dimulai dengan " <![CDATA[ " dan diakhiri dengan " ]]> ":
<script><![CDATA[function matchwo(a,b){if (a < b && a < 0) maka{return 1;}else{return 0;}}]]></script>
Pada contoh di atas, parser mengabaikan semua yang ada di bagian CDATA.
Catatan pada bagian CDATA:
Bagian CDATA tidak boleh berisi string "]]>". Bagian CDATA yang disarangkan juga tidak diperbolehkan.
Tanda "]]>" yang menandai akhir bagian CDATA tidak boleh berisi spasi atau baris baru.
Komentar pada bagian CDATA di atas adalah aturan XML CDATA yang perlu Anda ikuti!
Di bagian selanjutnya, kami akan menjelaskan pengkodean XML.