ขั้นตอนที่สามคือการกำหนดการเข้ารหัสภาษาของคุณ บางอย่างเช่นนี้:
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
เพื่อให้เบราว์เซอร์ตีความได้อย่างถูกต้องและผ่านการตรวจสอบโค้ด W3C เอกสาร XHTML ทั้งหมดจะต้องประกาศภาษาการเข้ารหัสที่พวกเขาใช้ โดยทั่วไปเราใช้ gb2312 (ภาษาจีนตัวย่อ) นอกจากนี้ยังสามารถใช้ Unicode และ ISO-8859-1 เพื่อสร้างหลายภาษาได้ -หน้าภาษา ฯลฯ กำหนดตามความต้องการของคุณ
โดยปกติแล้วคำจำกัดความนี้ก็เพียงพอแล้ว อย่างไรก็ตาม ควรเพิ่มว่าเอกสาร XML ไม่ได้กำหนดการเข้ารหัสภาษาในลักษณะนี้
<?xml version="1.0" encoding="gb2312"?>
คุณสามารถดูข้อความที่คล้ายกันได้ในบรรทัดแรกของโค้ดในหน้าแรกของ Macromedia.com นี่เป็นวิธีการกำหนดคำจำกัดความที่แนะนำโดย W3C แล้วทำไมเราไม่นำแนวทางนี้มาใช้ล่ะ? เหตุผลก็คือเบราว์เซอร์บางตัวรองรับมาตรฐานได้ไม่สมบูรณ์ และไม่สามารถเข้าใจวิธีการกำหนดดังกล่าวได้อย่างถูกต้อง เช่น IE6/windows ดังนั้นภายใต้แผนการเปลี่ยนแปลงปัจจุบัน เรายังคงแนะนำให้ใช้วิธีเมตา แน่นอนคุณสามารถเขียนได้ทั้งสองวิธี
เมื่อดูซอร์สโค้ดของเว็บไซต์นี้ คุณจะพบว่ามีอีกประโยคหนึ่งที่มีการกำหนดการเข้ารหัสภาษา:
<meta http-equiv="Content-Language" content="gb2312" />
ข้อมูลนี้เขียนขึ้นสำหรับเบราว์เซอร์รุ่นเก่าเพื่อให้แน่ใจว่าเบราว์เซอร์ต่างๆ สามารถตีความหน้าเว็บได้อย่างถูกต้อง
หมายเหตุ: ที่ส่วนท้ายของคำสั่งประกาศข้างต้น คุณจะเห็นเครื่องหมายทับ "/" ซึ่งแตกต่างจากการเขียนโค้ด HTML4.0 ก่อนหน้านี้ เหตุผลก็คือกฎไวยากรณ์ XHTML กำหนดให้แท็กทั้งหมดต้องมีจุดเริ่มต้นและจุดสิ้นสุด ตัวอย่างเช่น <body> และ </body>, <p> และ </p> ฯลฯ สำหรับแท็กที่ไม่ได้จับคู่ จะต้องเพิ่มช่องว่างที่ส่วนท้ายของแท็ก ตามด้วย "/" ตัวอย่างเช่น <br> เขียนเป็น <br /> และ <img> เขียนเป็น <img /> เหตุผลในการเพิ่มช่องว่างคือการป้องกันไม่ให้เบราว์เซอร์จดจำรหัสเมื่อเชื่อมต่อเข้าด้วยกัน