세 번째 단계는 다음과 같이 언어 인코딩을 정의하는 것입니다.
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
브라우저에서 올바르게 해석되고 W3C 코드 확인을 통과하려면 모든 XHTML 문서가 사용하는 인코딩 언어를 선언해야 합니다. 일반적으로 gb2312(중국어 간체)를 사용합니다. 또한 다중 생성을 위해 유니코드와 ISO-8859-1을 사용할 수도 있습니다. -언어 페이지 등, 필요에 따라 정의합니다.
일반적으로 이 정의로 충분합니다. 그러나 XML 문서는 이러한 방식으로 언어 인코딩을 정의하지 않는다는 점을 추가해야 합니다.
<?xml version="1.0" 인코딩="gb2312"?>
Macromedia.com 홈페이지의 첫 번째 코드 줄에서도 비슷한 내용을 볼 수 있습니다. 이는 W3C에서 권장하는 정의 방법이기도 합니다. 그렇다면 이 접근 방식을 채택하면 어떨까요? 그 이유는 일부 브라우저가 표준을 불완전하게 지원하고 IE6/windows와 같은 정의 방법을 올바르게 이해할 수 없기 때문입니다. 따라서 현재 전환 계획에서는 여전히 메타 방식을 사용하는 것이 좋습니다. 물론 두 가지 방법 모두 쓸 수 있습니다.
이 웹사이트의 소스 코드를 보면 언어 인코딩이 정의된 문장이 하나 더 있다는 것을 알 수 있습니다.
<meta http-equiv="Content-Language" content="gb2312" />
이는 다양한 브라우저가 페이지를 올바르게 해석할 수 있도록 이전 브라우저용으로 작성되었습니다.
참고: 위 선언문 끝에 슬래시 "/"가 표시되는데, 이는 이전 HTML4.0 코드 작성과 다릅니다. 그 이유는 XHTML 구문 규칙에 따라 모든 태그에 시작과 끝이 있어야 하기 때문입니다. 예를 들어 <body> 및 </body>, <p> 및 </p> 등입니다. 페어링되지 않은 태그의 경우 태그 끝에 공백을 추가하고 그 뒤에 "/"를 추가해야 합니다. 예를 들어 <br>은 <br />로 쓰고, <img>는 <img />로 쓴다. 공백을 넣는 이유는 코드가 서로 연결될 때 브라우저가 인식하지 못하도록 하기 위함이다.