Grundlegende Grammatik von JAVASCRIPT - Zeichensatz
1: Zeichensatz,
Sprache, egal wie einfach oder komplex, besteht immer aus Symbolen. Die Sammlung von Symbolen, die eine Sprache bilden, ist der „Zeichensatz“ dieser Sprache Der chinesische Zeichensatz besteht aus 26 Großbuchstaben und 26 Kleinbuchstaben sowie mehreren Satzzeichen. Jedes chinesische Zeichen kann
im Computerbereich
als „Zeichensatz“ bezeichnet werdendie einen Text in verschlüsselter Form darstellen. Daher bezieht sich der Zeichensatz von JAVASCRIPT auf den Satz zulässiger Zeichenbereiche, aus denen das JAVASCRIPT-Programm besteht [1].
Zu den gängigen Standardzeichensätzen gehören ASCLL, ISO, LATIN-1, GBK und UNICODE. Unter diesen ist ASCLL ein 7-Bit-Kodierungszeichensatz, der grundsätzlich nur auf Englisch anwendbar ist. Die 8-Bit-Kodierung ISO-LATIN-1 unterstützt die meisten lateinischen Sprachen, während die 16-Bit-Kodierung GBK und UNICODE die ostchinesischen Sprachen vollständig unterstützt. Sprache.
In den Standards vor ECMASCRIPTV3 unterstützte die JAVASCRIPT-Anweisung selbst den ASCLL-Zeichensatz, aber der UNICODE-Zeichensatz durfte weiterhin in Kommentaren oder in Anführungszeichen eingeschlossenen Zeichensatzliteralen erscheinen und konnte von Parsern, die UMICODE unterstützen, korrekt verarbeitet werden.
Bei Zeichensätzen ist zu beachten, dass Browser in der Regel selbst mehrere Arten von Encodern unterstützen. Daher muss es als Programmskript, das in ein Seitendokument eingefügt wird, nicht nur seine eigene Codierung berücksichtigen, sondern auch die Kompatibilität des Browser-Encoders vollständig berücksichtigen. Bei Browsern, die einen Encoder erzwingen, der UNICODE nicht unterstützt, schlägt die Ausführung von JAVASCRIPT fehl, da das Chinesisch in den Kommentaren des Skriptcodes nicht korrekt analysiert werden kann.