Langkah ketiga adalah menentukan pengkodean bahasa Anda, seperti ini:
<meta http-equiv="Jenis Konten" content="teks/html; charset=gb2312" />
Agar dapat diinterpretasikan dengan benar oleh browser dan lolos verifikasi kode W3C, semua dokumen XHTML harus menyatakan bahasa pengkodean yang mereka gunakan. Kami biasanya menggunakan gb2312 (Cina Sederhana). -halaman bahasa. dll., tentukan sesuai kebutuhan Anda.
Biasanya definisi ini sudah cukup. Namun, harus ditambahkan bahwa dokumen XML tidak mendefinisikan pengkodean bahasa dengan cara ini. XML didefinisikan sebagai berikut:
<?xml versi="1.0" pengkodean="gb2312"?>
Anda dapat melihat pernyataan serupa di baris pertama kode di beranda Macromedia.com. Ini juga merupakan metode definisi yang direkomendasikan oleh W3C. Jadi mengapa kita tidak mengadopsi pendekatan ini saja? Alasannya adalah beberapa browser memiliki dukungan standar yang tidak lengkap dan tidak dapat memahami dengan benar metode definisi tersebut, seperti IE6/windows. Oleh karena itu, berdasarkan rencana transisi saat ini, kami tetap menyarankan penggunaan metode meta. Tentu saja, Anda bisa menulis dua arah.
Melihat kode sumber situs web ini, Anda akan menemukan ada satu kalimat lagi yang mendefinisikan pengkodean bahasa:
<meta http-equiv="Isi-Bahasa" content="gb2312" />
Ini ditulis untuk browser lama untuk memastikan bahwa berbagai browser dapat menafsirkan halaman dengan benar.
Catatan: Di akhir pernyataan deklarasi di atas, Anda melihat garis miring "/", yang berbeda dengan penulisan kode HTML4.0 kita sebelumnya. Alasannya adalah aturan sintaksis XHTML mengharuskan semua tag harus memiliki awal dan akhir. Misalnya <body> dan </body>, <p> dan </p>, dll. Untuk tag yang tidak berpasangan, wajib menambahkan spasi di akhir tag, diikuti dengan tanda "/". Misalnya, <br> ditulis sebagai <br />, dan <img> ditulis sebagai <img />. Alasan penambahan spasi adalah untuk mencegah browser mengenali kode-kode tersebut ketika keduanya terhubung bersama.