garis besar:
Perkenalan
1. Istilah yang berhubungan dengan dokumen XML
2. Istilah-istilah terkait DTD
Perkenalan
Hal yang paling menyusahkan bagi pemula untuk mempelajari XML adalah banyaknya konsep terminologi baru yang harus dipahami. Karena XML sendiri juga merupakan teknologi baru, ia terus berkembang dan berubah. Organisasi dan perusahaan jaringan besar (Microsoft, IBM, SUN, dll.) terus-menerus memperkenalkan wawasan dan standar mereka sendiri, sehingga tidak mengherankan jika konsep-konsep baru muncul. terbang kemana-mana. Tidak ada lembaga atau organisasi resmi di Tiongkok yang secara resmi menyebutkan istilah-istilah ini. Sebagian besar buku teks berbahasa Mandarin yang Anda lihat tentang XML diterjemahkan berdasarkan pemahaman penulisnya sendiri. Ada yang benar dan ada yang salah, yang semakin menghambat pengembangan XML kami memahami dan mempelajari konsep-konsep ini.
Penjelasan istilah XML yang akan Anda lihat di bawah ini juga merupakan pemahaman dan terjemahan penulis sendiri. Ajie didasarkan pada spesifikasi standar XML1.0 yang dirilis oleh organisasi W3C dan dokumentasi resmi terkait. Dapat dipastikan bahwa pemahaman-pemahaman tersebut pada dasarnya benar, setidaknya tidak salah. Jika Anda ingin membaca dan memahami lebih jauh, saya telah mencantumkan sumber dan link sumber terkait di akhir artikel ini, yang dapat Anda akses langsung. Oke, mari kita mulai bisnisnya:
1. Istilah yang berhubungan dengan dokumen XML
Apa itu dokumen XML? Anda tahu file kode sumber HTML? Dokumen XML adalah file kode sumber XML yang ditulis dengan tag XML. Dokumen XML juga merupakan file teks biasa ASCII yang dapat Anda buat dan modifikasi menggunakan Notepad. Nama akhiran dokumen XML adalah .XML, misalnya myfile.xml. Anda juga dapat langsung membuka file .xml menggunakan browser IE5.0 atau lebih tinggi, tetapi yang Anda lihat adalah "kode asli XML" dan konten halaman tidak akan ditampilkan. Anda dapat mencoba menyimpan kode berikut sebagai myfile.xml:
<?xml versi="1.0" pengkodean="GB2312"?>
<file saya>
<title>Panduan Pembelajaran Mudah XML</title>
<penulis>ajie</penulis>
<email>[email protected]</email>
<tanggal>20010115</tanggal>
</filesaya>
Dokumen XML berisi tiga bagian:
1. Deklarasi dokumen XML;
2. Definisi jenis dokumen;
3. Tandai konten yang dibuat dengan XML.
Contoh:
<?xml versi="1.0"?>
<!DOCTYPE daftar file SISTEM "filelist.dtd">
<daftar file>
<file saya>
<title>MULAI CEPAT XML</title>
<penulis>ajie</penulis>
</filesaya>
...
</daftar file>
Baris pertama <?xml version="1.0"?> adalah deklarasi dokumen XML. Baris kedua menunjukkan bahwa dokumen ini menggunakan filelist.dtd untuk menentukan jenis dokumen.
Mari kita pahami istilah-istilah yang relevan dalam dokumen XML:
1.Elemen:
Kita sudah mengetahui elemen dalam HTML. Ini adalah unit terkecil yang membentuk sebuah dokumen HTML, begitu pula dalam XML. Sebuah elemen didefinisikan oleh sebuah identifier, termasuk identifier awal dan akhir serta kontennya, seperti ini: <author>ajie</author>
Satu-satunya perbedaan adalah: dalam HTML, tagnya tetap, tetapi dalam XML, tag harus dibuat oleh Anda.
2.Tag (logo)
Pengidentifikasi digunakan untuk mendefinisikan elemen. Dalam XML, tag harus muncul berpasangan, mengelilingi data. Nama pengenalnya sama dengan nama elemennya. Misalnya elemen seperti ini:
<penulis>ajie</penulis>
Dimana <author> adalah pengidentifikasinya.
3.Atribut:
Apa itu properti? Lihatlah kode HTML ini:<font color="red">kata</font>. Diantaranya, warna merupakan salah satu atribut font.
Atribut adalah deskripsi dan penjelasan lebih lanjut dari logo. Sebuah logo dapat memiliki beberapa atribut, seperti atribut font dan ukurannya. Atribut pada XML sama dengan atribut pada HTML, setiap atribut mempunyai nama dan nilainya masing-masing. Contoh:
<author sex="female">ajie</author>
Atribut dalam XML juga didefinisikan sendiri. Sebaiknya Anda mencoba untuk tidak menggunakan atribut dan mengubah atribut menjadi sub-elemen.
<penulis>ajie
<seks>perempuan</seks>
</penulis>
Alasannya adalah atribut tidak dapat dengan mudah diperluas dan dimanipulasi oleh program.
4.Deklarasi
Di baris pertama semua dokumen XML terdapat deklarasi XML. Deklarasi ini menunjukkan bahwa dokumen ini adalah dokumen XML dan spesifikasi versi XML mana yang diikuti. Pernyataan deklarasi XML terlihat seperti ini:
<?xml versi="1.0"?>
5.DTD (definisi tipe file)
DTD digunakan untuk mendefinisikan elemen, atribut, dan hubungan antar elemen dalam dokumen XML.
File DTD dapat digunakan untuk mendeteksi apakah struktur dokumen XML sudah benar. Namun membuat dokumen XML tidak selalu memerlukan file DTD. Penjelasan rinci tentang file DTD akan dicantumkan secara terpisah di bawah.
6. XML yang terbentuk dengan baik (XML yang terbentuk dengan baik)
Dokumen yang mematuhi aturan sintaksis XML dan mematuhi spesifikasi XML disebut "terbentuk dengan baik". Jika semua markup Anda benar-benar mematuhi spesifikasi XML, maka dokumen XML Anda tidak memerlukan file DTD untuk mendefinisikannya.
Dokumen yang dibuat dengan baik harus dimulai dengan deklarasi XML, seperti:
<?xml version="1.0" standalone="yes" coding="UTF-8"?>
Diantaranya, Anda harus menunjukkan versi XML yang sesuai dengan dokumen tersebut, yang saat ini 1.0; kedua, menjelaskan bahwa dokumen tersebut "independen", dan tidak memerlukan file DTD untuk memverifikasi apakah identifikasi di dalamnya valid; , Anda harus menunjukkan pengkodean bahasa yang digunakan dalam dokumen. Defaultnya adalah UTF-8. Jika Anda menggunakan bahasa Mandarin, Anda perlu mengaturnya ke GB2312.
Dokumen XML yang dibuat dengan baik harus memiliki elemen root, yang merupakan elemen pertama yang dibuat segera setelah deklarasi. Semua elemen lainnya adalah elemen turunan dari elemen root ini dan termasuk dalam grup elemen root.
Konten dokumen XML yang dibentuk dengan baik harus ditulis sesuai dengan sintaks XML. (Kami akan menjelaskan sintaks XML secara detail di bab berikutnya)
7.XML yang valid (XML yang valid)
Dokumen XML yang mematuhi aturan sintaksis XML dan mematuhi spesifikasi file DTD yang sesuai disebut dokumen XML yang valid. Perhatikan bahwa kami membandingkan "XML yang terbentuk dengan baik" dan "Valid
XML", perbedaan terbesar di antara keduanya adalah yang satu sepenuhnya mematuhi spesifikasi XML, sedangkan yang lain memiliki "Definisi Tipe Dokumen (DTD)" sendiri.
Proses membandingkan dokumen XML dengan file DTD-nya untuk melihat apakah dokumen tersebut mematuhi aturan DTD disebut validasi. Proses ini biasanya ditangani oleh perangkat lunak yang disebut parser.
Dokumen XML yang valid juga harus diawali dengan deklarasi XML, misalnya:
<?xml version="1.0" standalone="no" encode="UTF-8"?>
Berbeda dengan contoh di atas, pada atribut standalone (independen), "no" disetel di sini karena harus digunakan dengan DTD yang sesuai. File DTD didefinisikan sebagai berikut:
<!DOCTYPE jenis dokumen SISTEM/PUBLIK "nama-dtd">
di dalam:
"!DOCTYPE" berarti Anda ingin mendefinisikan DOCTYPE;
"type-of-doc" adalah nama jenis dokumen yang Anda tentukan, biasanya sama dengan nama file DTD;
Hanya gunakan salah satu dari dua parameter "SYSTEM/PUBLIC". SISTEM mengacu pada URL file DTD pribadi yang digunakan oleh dokumen, sedangkan PUBLIC mengacu pada URL file DTD publik yang digunakan oleh dokumen.
"dtd-name" adalah URL dan nama file DTD. Semua file DTD memiliki akhiran ".dtd".
Kita masih menggunakan contoh di atas, seharusnya ditulis seperti ini:
<?xml version="1.0" standalone="no" encode="UTF-8"?>
<!DOCTYPE filelist SYSTEM "filelist.dtd">
2. Istilah terkait DTD
Apa itu DTD, sudah kami sebutkan secara singkat di atas. DTD adalah metode yang efektif untuk memastikan bahwa format dokumen XML sudah benar. Anda dapat membandingkan dokumen XML dan file DTD untuk melihat apakah dokumen tersebut sesuai dengan spesifikasi dan apakah elemen dan tag digunakan dengan benar. Dokumen DTD memuat: aturan definisi elemen, aturan definisi hubungan antar elemen, atribut yang dapat digunakan oleh elemen, dan aturan entitas atau simbol yang dapat digunakan.
File DTD juga merupakan file teks ASCII dengan akhiran .dtd. Misalnya: file saya.dtd.
Mengapa menggunakan file DTD? Pemahaman saya adalah memenuhi berbagi jaringan dan interaksi data. Manfaat terbesar menggunakan DTD adalah berbagi file DTD. (Ini adalah atribut PUBLIC dalam pernyataan deskripsi DTD di atas). Misalnya, jika dua orang di industri yang sama dan wilayah berbeda menggunakan file DTD yang sama sebagai spesifikasi pembuatan dokumen, data mereka dapat dengan mudah dipertukarkan dan dibagikan. Jika orang lain di Internet ingin menambahkan data, mereka hanya perlu membuat dokumen sesuai spesifikasi DTD publik, dan mereka dapat segera bergabung.
Saat ini, sudah tersedia sejumlah besar file DTD tertulis. Menargetkan industri dan aplikasi yang berbeda, file DTD ini telah menetapkan aturan elemen dan label yang sama. Anda tidak perlu membuatnya ulang sendiri, cukup tambahkan logo baru yang Anda perlukan berdasarkan logo tersebut.
Tentu saja, jika Anda mau, Anda dapat membuat DTD Anda sendiri, yang mungkin lebih cocok dengan dokumen Anda. Membuat DTD Anda sendiri juga sangat sederhana. Umumnya, Anda hanya perlu mendefinisikan 4-5 elemen.
Ada dua cara untuk memanggil file DTD:
1. DTD terkandung langsung di dalam dokumen XML
Yang perlu Anda lakukan hanyalah memasukkan beberapa instruksi khusus ke dalam deklarasi DOCTYPE, seperti ini:
Kami memiliki dokumen XML:
<?xml versi="1.0" pengkodean="GB2312"?>
<file saya>
<title>Panduan Pembelajaran Mudah XML</title>
<penulis>ajie</penulis>
</filesaya>
Kita cukup menyisipkan kode berikut setelah baris pertama:
<!DOCTYPE file saya [
<!Judul ELEMEN (#PCDATA)>
<!ELEMENT penulis (#PCDATA)>
<!Hak cipta ENTITY "Hak Cipta 2001, Ajie.">
]>
2. Panggil file DTD independen
Simpan dokumen DTD sebagai file .dtd, lalu panggil di baris deklarasi DOCTYPE. Misalnya, simpan kode berikut sebagai myfile.dtd
<!ELEMENT myfile (judul, penulis)>
<!Judul ELEMEN (#PCDATA)>
<!ELEMENT penulis (#PCDATA)>
Kemudian panggil itu dalam dokumen XML, masukkan setelah baris pertama:
<!DOCTYPE SISTEM file saya "file saya.dtd">
Kita dapat melihat bahwa panggilan ke js dalam dokumen DTD dan HTML serupa. Mengenai cara menulis dokumen DTD, kami akan memperkenalkannya bersama dengan sintaks dokumen XML di bab berikutnya.
Mari pelajari terminologi terkait DTD:
1.Skema (Perencanaan)
Skema adalah deskripsi aturan data. Skema melakukan dua hal:
a.Mendefinisikan tipe data elemen dan hubungan antar elemen;
b. Ini mendefinisikan tipe konten yang dapat ditampung oleh elemen.
DTD adalah skema untuk dokumen XML.
2.Pohon Dokumen
Kami telah menyebutkan "pohon dokumen" di Bab 2. Ini adalah representasi gambar dari struktur hierarki elemen dokumen. Pohon struktur dokumen berisi elemen akar, yang merupakan elemen tingkat atas (yaitu, elemen pertama setelah pernyataan deklarasi XML). Lihat contohnya:
<?xml versi="1.0"?>
<daftar file>
<file saya>
<judul>...</judul>
<penulis>...</penulis>
</filesaya>
</daftar file>
Contoh di atas disusun dalam struktur tiga tingkat menjadi bentuk "pohon", di mana <filelist> adalah elemen akarnya. Dalam file XML dan DTD, elemen pertama yang ditentukan adalah elemen root.
3.Elemen Induk/Elemen Anak
Elemen induk adalah elemen yang memuat elemen lain, dan elemen yang dikandungnya disebut elemen turunannya. Lihatlah "pohon struktur" di atas, di mana <myfile> adalah elemen induk, <title>, <author> adalah elemen turunannya, dan <myfile> adalah elemen turunan dari <filelist>. Elemen tingkat terakhir yang tidak mengandung elemen turunan seperti <title> juga disebut "elemen halaman".
4.Parser (perangkat lunak penguraian)
Parser adalah perangkat lunak alat yang memeriksa apakah dokumen XML mematuhi spesifikasi DTD.
Parser XML telah dikembangkan menjadi dua kategori: satu adalah "parser non-konfirmasi", yang hanya mendeteksi apakah dokumen mematuhi aturan sintaksis XML dan apakah pohon dokumen dibuat dengan pengidentifikasi elemen. Yang lainnya adalah "paeser kelas konfirmasi", yang tidak hanya mendeteksi sintaksis dokumen dan pohon struktur, tetapi juga membandingkan dan menganalisis apakah pengidentifikasi elemen yang Anda gunakan mematuhi spesifikasi file DTD yang sesuai.
Parser dapat digunakan secara mandiri atau sebagai bagian dari perangkat lunak pengeditan atau browser. Dalam daftar sumber terkait berikut, saya telah mencantumkan beberapa parser yang populer saat ini.
Oke, melalui pembelajaran Bab 3, kita telah mempelajari beberapa istilah dasar XML dan DTD, namun kita masih belum mengetahui cara menulis file-file ini dan jenis sintaksis apa yang perlu diikuti tentang penulisan XML dan sintaksis dokumen DTD. Silakan lanjutkan browsing, terima kasih!