Bab 4 Sintaks XML
garis besar:
1. Aturan sintaksis XML 2. Sintaks elemen 3. Sintaks komentar 4. Sintaks CDATA 5. Sintaks ruang nama 6. Sintaks entitas 7. Sintaks DTD
Dengan mempelajari tiga bab sebelumnya, kita telah memahami apa itu XML, prinsip implementasinya, dan terminologi terkait. Selanjutnya, kita akan mulai mempelajari spesifikasi sintaks XML dan menulis dokumen XML kita sendiri.
1. Aturan sintaks XML
Dokumen XML mirip dengan kode asli HTML, dan juga menggunakan tag untuk mengidentifikasi konten. Aturan penting berikut harus diikuti saat membuat dokumen XML:
Aturan 1: Harus ada pernyataan deklarasi XML. Kami telah menyebutkan ini di bab sebelumnya. Deklarasinya adalah kalimat pertama dari dokumen XML dan formatnya adalah sebagai berikut:
<?xml version="1.0" standalone="ya/tidak" coding="UTF-8"?>
Tujuan dari deklarasi ini adalah untuk memberi tahu browser atau program pemrosesan lainnya bahwa dokumen ini adalah dokumen XML. Versi dalam pernyataan deklarasi menunjukkan versi spesifikasi XML yang dipatuhi dokumen; mandiri menunjukkan apakah dokumen dilengkapi dengan file DTD, jika demikian, parameternya adalah tidak; standarnya adalah UTF-8.
Aturan 2: Apakah terdapat file DTD. Jika dokumen tersebut adalah "dokumen XML yang valid" (lihat bab sebelumnya), maka dokumen tersebut harus memiliki file DTD yang sesuai dan benar-benar sesuai dengan spesifikasi yang ditetapkan oleh file DTD. Pernyataan deklarasi file DTD mengikuti pernyataan deklarasi XML dalam format berikut:
<!DOCTYPE jenis dokumen SISTEM/PUBLIK "nama-dtd">
di dalam:
"!DOCTYPE" berarti Anda ingin mendefinisikan DOCTYPE;
"type-of-doc" adalah nama jenis dokumen yang Anda tentukan, biasanya sama dengan nama file DTD;
Hanya gunakan salah satu dari dua parameter "SYSTEM/PUBLIC". SISTEM mengacu pada URL file DTD pribadi yang digunakan oleh dokumen, sedangkan PUBLIC mengacu pada URL file DTD publik yang digunakan oleh dokumen.
"dtd-name" adalah URL dan nama file DTD. Semua file DTD memiliki akhiran ".dtd".
Kita masih menggunakan contoh di atas, seharusnya ditulis seperti ini:
<?xml version="1.0" standalone="no" encode="UTF-8"?>
<!DOCTYPE daftar file SISTEM "filelist.dtd">
Aturan 3: Perhatikan kapitalisasi Anda Dalam dokumen XML, ada perbedaan antara huruf besar dan kecil. <P> dan <p> adalah pengidentifikasi yang berbeda. Perhatikan bahwa saat menulis elemen, huruf besar/kecil pengidentifikasi depan dan belakang harus tetap sama. Misalnya: <Author>ajie</Author>, penulisan <Author>ajie</author> salah.
Anda sebaiknya membiasakan huruf kapital semua, huruf kecil semua, atau huruf besar pada huruf pertama. Hal ini mengurangi kesalahan dokumentasi yang disebabkan oleh ketidakcocokan kasus.
Aturan 4: Tambahkan tanda kutip pada nilai atribut. Dalam kode HTML, nilai atribut boleh diberi tanda kutip atau tidak. Misalnya: <font color=red>kata</font> dan <font color="red">kata</font> keduanya dapat diinterpretasikan dengan benar oleh browser.
Namun dalam XML diatur bahwa semua nilai atribut harus diberi tanda kutip (bisa berupa tanda kutip tunggal atau tanda kutip ganda), jika tidak maka akan dianggap sebagai kesalahan.
Aturan 5: Semua tag harus memiliki tag penutup yang sesuai. Dalam HTML, tag tidak boleh muncul berpasangan, seperti?lt;br>. Dalam XML diatur bahwa semua tag harus muncul berpasangan. Jika ada tag awal, harus ada tag akhir. Jika tidak maka akan dianggap kesalahan.
Aturan 6: Semua tag kosong juga harus ditutup. Tag kosong adalah tag yang tidak memiliki konten di antara pasangan tag. Misalnya <br>, <img> dan tag lainnya. Dalam XML ditetapkan bahwa semua tag harus memiliki tag akhir. Untuk tag kosong tersebut, cara pemrosesan dalam XML adalah dengan menambahkan / di akhir tag asli, dan itu saja. Misalnya:
<br> harus ditulis sebagai <br />;
<META name="keywords" content="XML, SGML, HTML"> harus ditulis sebagai <META name="keywords" content="XML, SGML, HTML" />;
<IMG src= "cool.gif"> harus ditulis sebagai <IMG src= "cool.gif" />
Bab 4 Sintaks XML
2. Sintaks elemen
Sebuah elemen terdiri dari sepasang pengidentifikasi dan kontennya. Seperti ini: ajie. Nama elemen dan nama pengenalnya sama. Identitas dapat dijelaskan lebih lanjut menggunakan atribut.
Dalam XML, tidak ada kata khusus, jadi Anda bisa menggunakan kata apa pun sebagai nama elemen. Namun peraturan berikut juga harus diperhatikan:
1. Nama dapat berisi huruf, angka dan huruf lainnya;
2. Nama tidak boleh diawali dengan angka atau “_” (garis bawah);
3. Nama tidak boleh diawali dengan huruf xml (atau XML atau Xml..)
4. Nama tidak boleh mengandung spasi.
5. Nama tidak boleh mengandung ":" (titik dua)
Untuk membuat elemen lebih mudah dibaca, dipahami, dan dimanipulasi, kami memiliki beberapa saran lagi:
1. Jangan gunakan "." Karena dalam banyak bahasa pemrograman, "." digunakan sebagai atribut suatu objek, misalnya: font.color. Untuk alasan yang sama, sebaiknya tidak menggunakan "-". Jika harus digunakan, ganti dengan "_";
2. Usahakan nama sesingkat mungkin.
3. Usahakan menggunakan standar yang sama untuk kapitalisasi dan kapitalisasi nama.
4. Nama dapat menggunakan karakter non-Inggris, seperti bahasa Mandarin. Namun beberapa perangkat lunak mungkin tidak mendukungnya. (IE5 saat ini mendukung elemen berbahasa Mandarin.)
Selain itu, tambahkan sedikit penjelasan mengenai propertinya. Dalam HTML, atribut dapat digunakan untuk menentukan format tampilan elemen. Misalnya: <font color="red">word</font> akan menampilkan kata berwarna merah. Dalam XML, atribut hanyalah deskripsi pengidentifikasi dan tidak ada hubungannya dengan tampilan konten elemen. Misalnya kalimat yang sama: <font color="red">word</font> tidak akan menampilkan kata dengan warna merah. (Jadi, beberapa netizen akan bertanya: Bagaimana cara menampilkan teks berwarna merah dalam XML? Ini memerlukan penggunaan CSS atau XSL, yang akan kami jelaskan secara detail di bawah.)
3. Sintaks komentar
Komentar ditambahkan ke dokumen XML untuk memudahkan pembacaan dan pemahaman, dan tidak akan ditafsirkan oleh program atau ditampilkan oleh browser.
Sintaks untuk komentar adalah sebagai berikut:
<!-- Berikut informasi komentarnya-->
Seperti yang Anda lihat, ini sama dengan sintaks komentar di HTML, yang sangat mudah. Mengembangkan kebiasaan berkomentar yang baik akan membuat dokumen Anda lebih mudah dipelihara, dibagikan, dan terlihat lebih profesional.
4. Sintaks CDATA
Nama lengkap CDATA adalah data karakter yang diterjemahkan sebagai data karakter. Saat kita menulis dokumen XML, terkadang kita perlu menampilkan huruf, angka, dan simbol lainnya, seperti "<". Dalam XML, karakter ini sudah memiliki arti khusus. Ini memerlukan penggunaan sintaks CDATA. Format sintaksnya adalah sebagai berikut:
<![CDATA[Tempatkan karakter yang akan ditampilkan di sini]]>
Misalnya:
<![CDATA[<AUTHOR sex="female">ajie</AUTHOR>]]>
Konten yang ditampilkan pada halaman tersebut adalah "<AUTHOR sex="female">ajie</AUTHOR>"
Bab 4 Sintaks XML
5. Sintaks Namespace
Namespace diterjemahkan menjadi namespace. Apa yang dilakukan namespace? Ketika kita menggunakan file DTD orang lain atau beberapa file DTD dalam dokumen XML, akan ada kontradiksi: karena pengidentifikasi dalam XML dibuat sendiri, dalam file DTD yang berbeda, nama pengidentifikasi mungkin sama tetapi memiliki arti yang berbeda menyebabkan kebingungan data.
Misalnya, dalam dokumen <table>meja kayu</table>, <table> mewakili sebuah tabel.
Di dokumen lain <table>namelist</table>, <table> mewakili sebuah tabel. Jika saya harus mengerjakan kedua dokumen secara bersamaan, akan terjadi konflik nama.
Untuk mengatasi masalah ini, kami memperkenalkan konsep namespace. Namespace membedakan pengidentifikasi ini dengan nama yang sama dengan menambahkan URL ke nama pengidentifikasi.
Namespace juga perlu dideklarasikan di awal dokumen XML. Sintaks deklarasinya adalah sebagai berikut:
<dokumen xmlns:namaanda='URL'>
Di mana nama Anda adalah nama ruang nama yang Anda tentukan, dan URL adalah URL ruang nama tersebut.
Dengan asumsi bahwa dokumen "tabel <tabel>" di atas berasal dari http://www.zhuozi.com, kita dapat mendeklarasikannya sebagai
<dokumen xmlns:zhuozi='http://www.zhuozi.com'>
Kemudian gunakan namespace yang ditentukan dalam tag berikutnya:
<zhuozi:meja>meja kayu</meja>
Ini membedakan kedua <tabel> tersebut. Catatan: Menyetel URL tidak berarti logo ini benar-benar perlu dibaca dari URL tersebut, ini hanya sebagai tanda pembeda.
6. Sintaks entitas
Entitas diterjemahkan sebagai "entitas". Fungsinya mirip dengan "makro" di Word, dan juga dapat dipahami sebagai templat di DW. Anda dapat menentukan terlebih dahulu suatu entitas dan kemudian memanggilnya beberapa kali dalam satu dokumen, atau memanggil entitas yang sama di beberapa dokumen.
Entitas dapat berisi karakter, teks, dll. Keuntungan menggunakan entitas adalah: 1. Dapat mengurangi kesalahan. Beberapa bagian yang identik dalam dokumen hanya perlu dimasukkan satu kali. 2. Meningkatkan efisiensi pemeliharaan. Misalnya, jika Anda memiliki 40 dokumen yang semuanya berisi entitas hak cipta, jika Anda perlu mengubah hak cipta ini, Anda tidak perlu mengubah semua file. Anda hanya perlu mengubah pernyataan entitas yang ditentukan sebelumnya.
XML mendefinisikan dua jenis entitas. Salah satunya adalah entitas biasa yang kita bicarakan di sini, digunakan dalam dokumen XML; yang lainnya adalah entitas parameter, digunakan dalam file DTD.
Sintaks definisi entitas adalah:
<!Nama file DOCTYPE [
<!ENTITY nama entitas "konten-entitas"
]
>
Misalnya, saya ingin mendefinisikan informasi hak cipta:
<!Hak cipta DOCTYPE [
<!Hak cipta ENTITY "Hak Cipta 2001, Ajie. Semua hak dilindungi undang-undang"
]
>
Jika konten informasi hak cipta saya dibagikan kepada orang lain dalam file XML, saya juga dapat menggunakan metode panggilan eksternal. Sintaksnya seperti ini:
<!Hak cipta DOCTYPE [
<!SISTEM hak cipta ENTITAS "http://www.sample.com/copyright.xml">
]
>
Sintaks referensi entitas yang ditentukan dalam dokumen adalah: &entity-name;
Misalnya, informasi hak cipta yang didefinisikan di atas ditulis sebagai ?hak cipta;
Contoh lengkapnya adalah sebagai berikut, Anda dapat menyalinnya dan menyimpannya sebagai hak cipta.xml untuk melihat contohnya:
<?xml versi="1.0" pengkodean="GB2312"?>
<!Hak cipta DOCTYPE [
<!Hak cipta ENTITY "Hak Cipta 2001, Ajie. Semua hak dilindungi undang-undang">
]>
<file saya>
<judul>XML</judul>
<penulis>ajie</penulis>
<email>[email protected]</email>
<tanggal>20010115</tanggal>
©benar;
</filesaya>
Bab 4 Sintaks XML
7. Sintaks DTD
DTD adalah file yang diperlukan untuk "dokumen XML yang valid". Kami menggunakan file DTD untuk menentukan aturan dan hubungan timbal balik elemen dan pengidentifikasi dalam dokumen. Bagaimana cara membuat file DTD? Mari kita belajar bersama:
1. Atur elemen
Elemen adalah blok penyusun dasar dokumen XML. Anda perlu mendefinisikan elemen di DTD dan kemudian menggunakannya dalam dokumen XML. Sintaks definisi suatu elemen adalah: <!ELEMENT DESCRIPTION (#PCDATA, DEFINITION)*>
menjelaskan:
"<!ELEMENT" adalah deklarasi suatu elemen, yang menunjukkan bahwa yang ingin Anda definisikan adalah sebuah elemen;
"DESKRIPSI" setelah pernyataan adalah nama elemen;
"(#PCDATA, DEFINITION)*>" adalah aturan penggunaan elemen ini. Aturan menentukan elemen apa saja yang dapat dikandungnya dan bagaimana elemen tersebut berhubungan satu sama lain. Tabel berikut menguraikan aturan untuk elemen:
2. Tabel aturan elemen: