Der dritte Schritt besteht darin, Ihre Sprachkodierung zu definieren, etwa so:
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
Um von Browsern korrekt interpretiert zu werden und die W3C-Codeüberprüfung zu bestehen, müssen alle XHTML-Dokumente die von ihnen verwendete Codierungssprache angeben. Wir verwenden im Allgemeinen gb2312 (vereinfachtes Chinesisch). Es ist auch möglich, Unicode und ISO-8859-1 zu verwenden, um Multi zu erstellen -Sprachseiten usw., definieren Sie nach Ihren Bedürfnissen.
Normalerweise reicht diese Definition aus. Es sollte jedoch hinzugefügt werden, dass XML-Dokumente die Sprachkodierung nicht auf diese Weise definieren. XML ist wie folgt definiert:
<?xml version="1.0"kodierung="gb2312"?>
Ähnliche Aussagen finden Sie in der ersten Codezeile auf der Homepage von Macromedia.com. Dies ist auch die vom W3C empfohlene Definitionsmethode. Warum übernehmen wir also nicht einfach diesen Ansatz? Der Grund dafür ist, dass einige Browser Standards nur unvollständig unterstützen und solche Definitionsmethoden wie IE6/Windows nicht richtig verstehen können. Daher empfehlen wir im Rahmen des aktuellen Übergangsplans weiterhin die Verwendung der Meta-Methode. Natürlich können Sie in beide Richtungen schreiben.
Wenn Sie sich den Quellcode dieser Website ansehen, werden Sie feststellen, dass es einen weiteren Satz gibt, in dem die Sprachkodierung definiert ist:
<meta http-equiv="Content-Language" content="gb2312" />
Dies ist für ältere Browser geschrieben, um sicherzustellen, dass verschiedene Browser die Seite korrekt interpretieren können.
Hinweis: Am Ende der obigen Deklarationsanweisung sehen Sie einen Schrägstrich „/“, der sich von unserem vorherigen HTML4.0-Code-Schreiben unterscheidet. Der Grund dafür ist, dass die XHTML-Syntaxregeln verlangen, dass alle Tags einen Anfang und ein Ende haben müssen. Zum Beispiel <body> und </body>, <p> und </p> usw. Bei ungepaarten Tags muss am Ende des Tags ein Leerzeichen gefolgt von einem „/“ hinzugefügt werden. Beispielsweise wird <br> als <br /> und <img> als <img /> geschrieben. Der Grund für das Hinzufügen von Leerzeichen besteht darin, zu verhindern, dass der Browser die Codes erkennt, wenn sie miteinander verbunden sind.