Bab 4 Sintaks XML
garis besar:
1. Aturan sintaksis XML 2. Sintaks elemen 3. Sintaks komentar 4. Sintaks CDATA 5. Sintaks ruang nama 6. Sintaks entitas 7. Sintaks DTD
Dengan mempelajari tiga bab sebelumnya, kita telah memahami apa itu XML, prinsip implementasinya, dan terminologi terkait. Selanjutnya, kita akan mulai mempelajari spesifikasi sintaks XML dan menulis dokumen XML kita sendiri.
1. Aturan sintaks XML
Dokumen XML mirip dengan kode asli HTML, dan juga menggunakan tag untuk mengidentifikasi konten. Aturan penting berikut harus diikuti saat membuat dokumen XML:
Aturan 1: Harus ada pernyataan deklarasi XML. Kami telah menyebutkan ini di bab sebelumnya. Deklarasinya adalah kalimat pertama dari dokumen XML dan formatnya adalah sebagai berikut:
Tujuan dari deklarasi ini adalah untuk memberi tahu browser atau program pemrosesan lainnya bahwa dokumen ini adalah dokumen XML. Versi dalam pernyataan deklarasi menunjukkan versi spesifikasi XML yang dipatuhi dokumen; mandiri menunjukkan apakah dokumen dilengkapi dengan file DTD, jika demikian, parameternya adalah tidak; standarnya adalah UTF-8.
Aturan 2: Apakah terdapat file DTD. Jika dokumen tersebut adalah "dokumen XML yang valid" (lihat bab sebelumnya), maka dokumen tersebut harus memiliki file DTD yang sesuai dan benar-benar sesuai dengan spesifikasi yang ditetapkan oleh file DTD. Pernyataan deklarasi file DTD mengikuti pernyataan deklarasi XML dalam format berikut:
di dalam:
"!DOCTYPE" berarti Anda ingin mendefinisikan DOCTYPE;
"type-of-doc" adalah nama jenis dokumen yang Anda tentukan, biasanya sama dengan nama file DTD;
Hanya gunakan salah satu dari dua parameter "SYSTEM/PUBLIC". SISTEM mengacu pada URL file DTD pribadi yang digunakan oleh dokumen, sedangkan PUBLIC mengacu pada URL file DTD publik yang digunakan oleh dokumen.
"dtd-name" adalah URL dan nama file DTD. Semua file DTD memiliki akhiran ".dtd".
Kita masih menggunakan contoh di atas, seharusnya ditulis seperti ini:
Aturan 3: Perhatikan kapitalisasi Anda Dalam dokumen XML, ada perbedaan antara huruf besar dan kecil.
dan
adalah pengidentifikasi yang berbeda. Perhatikan bahwa saat menulis elemen, huruf besar/kecil pengidentifikasi depan dan belakang harus tetap sama. Misalnya:
Anda sebaiknya membiasakan huruf kapital semua, huruf kecil semua, atau huruf besar pada huruf pertama. Hal ini mengurangi kesalahan dokumentasi yang disebabkan oleh ketidakcocokan kasus.
Aturan 4: Tambahkan tanda kutip pada nilai atribut. Dalam kode HTML, nilai atribut boleh diberi tanda kutip atau tidak. Misalnya: kata dan kata keduanya dapat diinterpretasikan dengan benar oleh browser.
Namun dalam XML diatur bahwa semua nilai atribut harus diberi tanda kutip (bisa berupa tanda kutip tunggal atau tanda kutip ganda), jika tidak maka akan dianggap sebagai kesalahan.
Aturan 5: Semua tag harus memiliki tag penutup yang sesuai. Dalam HTML, tag tidak boleh muncul berpasangan, seperti?lt;br>. Dalam XML diatur bahwa semua tag harus muncul berpasangan. Jika ada tag awal, harus ada tag akhir. Jika tidak maka akan dianggap kesalahan.
Aturan 6: Semua tag kosong juga harus ditutup. Tag kosong adalah tag yang tidak memiliki konten di antara pasangan tag. Misalnya
, dan tag lainnya. Dalam XML ditetapkan bahwa semua tag harus memiliki tag akhir. Untuk tag kosong tersebut, cara pemrosesan dalam XML adalah dengan menambahkan / di akhir tag asli, dan itu saja. Misalnya:
harus ditulis sebagai
;
harus ditulis sebagai ;
harus ditulis sebagai
Bab 4 Sintaks XML
2. Sintaks elemen
Sebuah elemen terdiri dari sepasang pengidentifikasi dan kontennya. Seperti ini: ajie. Nama elemen dan nama pengenalnya sama. Identitas dapat dijelaskan lebih lanjut menggunakan atribut.
Dalam XML, tidak ada kata khusus, jadi Anda bisa menggunakan kata apa pun sebagai nama elemen. Namun peraturan berikut juga harus diperhatikan:
1. Nama dapat berisi huruf, angka dan huruf lainnya;
2. Nama tidak boleh diawali dengan angka atau “_” (garis bawah);
3. Nama tidak boleh diawali dengan huruf xml (atau XML atau Xml..)
4. Nama tidak boleh mengandung spasi.
5. Nama tidak boleh mengandung ":" (titik dua)
Untuk membuat elemen lebih mudah dibaca, dipahami, dan dimanipulasi, kami memiliki beberapa saran lagi:
1. Jangan gunakan "." Karena dalam banyak bahasa pemrograman, "." digunakan sebagai atribut suatu objek, misalnya: font.color. Untuk alasan yang sama, sebaiknya tidak menggunakan "-". Jika harus digunakan, ganti dengan "_";
2. Usahakan nama sesingkat mungkin.
3. Usahakan menggunakan standar yang sama untuk kapitalisasi dan kapitalisasi nama.
4. Nama dapat menggunakan karakter non-Inggris, seperti bahasa Mandarin. Namun beberapa perangkat lunak mungkin tidak mendukungnya. (IE5 saat ini mendukung elemen berbahasa Mandarin.)
Selain itu, tambahkan sedikit penjelasan mengenai propertinya. Dalam HTML, atribut dapat digunakan untuk menentukan format tampilan elemen. Misalnya: word akan menampilkan kata berwarna merah. Dalam XML, atribut hanyalah deskripsi pengidentifikasi dan tidak ada hubungannya dengan tampilan konten elemen. Misalnya kalimat yang sama: word tidak akan menampilkan kata dengan warna merah. (Jadi, beberapa netizen akan bertanya: Bagaimana cara menampilkan teks berwarna merah dalam XML? Ini memerlukan penggunaan CSS atau XSL, yang akan kami jelaskan secara detail di bawah.)
3. Sintaks komentar
Komentar ditambahkan ke dokumen XML untuk memudahkan pembacaan dan pemahaman, dan tidak akan ditafsirkan oleh program atau ditampilkan oleh browser.
Sintaks untuk komentar adalah sebagai berikut:
Seperti yang Anda lihat, ini sama dengan sintaks komentar di HTML, yang sangat mudah. Mengembangkan kebiasaan berkomentar yang baik akan membuat dokumen Anda lebih mudah dipelihara, dibagikan, dan terlihat lebih profesional.
4. Sintaks CDATA
Nama lengkap CDATA adalah data karakter yang diterjemahkan sebagai data karakter. Saat kita menulis dokumen XML, terkadang kita perlu menampilkan huruf, angka, dan simbol lainnya, seperti "<". Dalam XML, karakter ini sudah memiliki arti khusus. Ini memerlukan penggunaan sintaks CDATA. Format sintaksnya adalah sebagai berikut:
Misalnya:
ajie]]>
Konten yang ditampilkan pada halaman tersebut adalah "
Bab 4 Sintaks XML
5. Sintaks Namespace
Namespace diterjemahkan menjadi namespace. Apa yang dilakukan namespace? Ketika kita menggunakan file DTD orang lain atau beberapa file DTD dalam dokumen XML, akan ada kontradiksi: karena pengidentifikasi dalam XML dibuat sendiri, dalam file DTD yang berbeda, nama pengidentifikasi mungkin sama tetapi memiliki arti yang berbeda menyebabkan kebingungan data.
Misalnya, dalam dokumen