الخطوة الثالثة هي تحديد ترميز اللغة الخاص بك، مثل هذا:
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
لكي يتم تفسيرها بشكل صحيح بواسطة المتصفحات وتمرير التحقق من رمز W3C، يجب أن تعلن جميع مستندات XHTML عن لغة الترميز التي تستخدمها. نستخدم بشكل عام gb2312 (الصينية المبسطة)، ومن الممكن أيضًا استخدام Unicode وISO-8859-1 لإنشاء ملفات متعددة - صفحات اللغة وما إلى ذلك، حددها وفقًا لاحتياجاتك.
عادة ما يكون هذا التعريف كافيا. ومع ذلك، يجب إضافة أن مستندات XML لا تحدد ترميز اللغة بهذه الطريقة.
<?xml version="1.0" encoding="gb2312"?>
يمكنك رؤية عبارات مماثلة في السطر الأول من التعليمات البرمجية على الصفحة الرئيسية لموقع Macromedia.com. وهذه أيضًا طريقة التعريف الموصى بها من قبل W3C. فلماذا لا نتبنى هذا النهج؟ والسبب هو أن بعض المتصفحات لا تتمتع بدعم كامل للمعايير ولا يمكنها فهم طرق التعريف هذه بشكل صحيح، مثل IE6/windows. لذلك، في ظل خطة النقل الحالية، ما زلنا نوصي باستخدام الطريقة الوصفية. وبطبيعة الحال، يمكنك الكتابة في كلا الاتجاهين.
بالنظر إلى الكود المصدري لهذا الموقع، ستجد أن هناك جملة أخرى يتم فيها تعريف ترميز اللغة:
<meta http-equiv="Content-Language" content="gb2312" />
تمت كتابة هذا للمتصفحات القديمة للتأكد من أن المتصفحات المختلفة يمكنها تفسير الصفحة بشكل صحيح.
ملاحظة: في نهاية بيان الإعلان أعلاه، ترى شرطة مائلة "/"، والتي تختلف عن كتابة كود HTML4.0 السابقة. والسبب هو أن قواعد بناء جملة XHTML تتطلب أن يكون لجميع العلامات بداية ونهاية. على سبيل المثال، <body> و </body>، و <p> و </p>، وما إلى ذلك. بالنسبة للعلامات غير المقترنة، يلزم إضافة مسافة في نهاية العلامة، متبوعة بـ "/". على سبيل المثال، يتم كتابة <br> كـ <br />، ويتم كتابة <img> كـ <img />. سبب إضافة المسافات هو منع المتصفح من التعرف على الرموز عندما تكون متصلة ببعضها البعض.