<message>ข้อความนี้ถูกแยกวิเคราะห์ด้วย</message>
parser ทำเช่นนี้เนื่องจากองค์ประกอบ XML สามารถมีองค์ประกอบอื่น ๆ ได้ ดังในตัวอย่างนี้ โดยที่องค์ประกอบ <name> มีองค์ประกอบอื่นอีกสององค์ประกอบ (ตัวแรกและตัวสุดท้าย):
<name><first>บิล</first><last>เกตส์</last></name>
และ parser จะแบ่งมันออกเป็นองค์ประกอบย่อยดังนี้:
<name><first>บิล</first><last>เกตส์</last></name>
Parsed character data (PCDATA) เป็นคำที่ใช้สำหรับข้อมูลข้อความที่แยกวิเคราะห์โดย XML parser
คำว่า CDATA คือข้อมูลข้อความที่ไม่ควรแยกวิเคราะห์โดยตัวแยกวิเคราะห์ XML
อักขระเช่น "<" และ "&" ผิดกฎหมายในองค์ประกอบ XML
"<" จะสร้างข้อผิดพลาดเนื่องจาก parser จะตีความอักขระนี้เป็นจุดเริ่มต้นขององค์ประกอบใหม่
"&" จะสร้างข้อผิดพลาดเนื่องจาก parser จะตีความอักขระนี้เป็นจุดเริ่มต้นของเอนทิตีอักขระ
ข้อความบางส่วน เช่น โค้ด JavaScript มีอักขระ "<" หรือ "&" จำนวนมาก เพื่อหลีกเลี่ยงข้อผิดพลาด คุณสามารถกำหนดโค้ดสคริปต์เป็น CDATA ได้
ทุกอย่างในส่วน CDATA จะถูกละเว้นโดย parser
ส่วน CDATA ขึ้นต้นด้วย " <![CDATA[ " และลงท้ายด้วย " ]]> ":
<script><![CDATA[function matchwo(a,b){if (a < b && a < 0) แล้ว{return 1;}else{return 0;}}]]></script>
ในตัวอย่างข้างต้น parser จะละเว้นทุกสิ่งในส่วน CDATA
หมายเหตุในส่วน CDATA:
ส่วน CDATA ไม่สามารถมีสตริง "]]>" ไม่อนุญาตให้ใช้ส่วน CDATA ที่ซ้อนกัน
เครื่องหมาย "]]>" ที่ส่วนท้ายของส่วน CDATA ต้องไม่มีช่องว่างหรือขึ้นบรรทัดใหม่
ความคิดเห็นในส่วน CDATA ด้านบนเป็นกฎของ XML CDATA ที่คุณต้องปฏิบัติตาม!
ในส่วนถัดไป เราจะอธิบายการเข้ารหัส XML