JAVASCRIPT の基本文法 - 文字セット
1: 文字セット、
音声は、どんなに単純でも複雑でも、常に記号で構成されています。言語を構成する記号の集合が、この言語の「文字セット」です。 26 個の大文字と 26 個の小文字といくつかの句読点からなる中国語の文字セットは、さらに複雑です。
コンピュータ分野では、文字セットは通常、文字の完全なセットを指します
。エンコードされた方法でテキストを構成するもの。したがって、JAVASCRIPT の文字セットは、JAVASCRIPT プログラムを構成する有効な文字範囲のセットを指します [1]
一般的な標準文字セットには、ASCLL、ISO、LATIN-1、GBK、および UNICODE が含まれます。このうち、ASCLL は 7 ビット エンコード文字セットで、基本的に英語にのみ適用されます。8 ビット ISO-LATIN-1 はほとんどのラテン語をサポートし、16 ビット エンコード GBK および UNICODE は中国語東部言語を完全にサポートします。言語。
ECMASCRIPTV3 より前の標準では、JAVASCRIPT 命令自体は ASCLL 文字セットをサポートしていましたが、UNICODE 文字セットは依然としてコメントまたは引用符で囲まれた文字セット文字列リテラルに出現することが許可されており、UMICODE をサポートするパーサーによって正しく処理できました。
文字セットに関して注意すべき点は、通常、ブラウザ自体が複数のタイプのエンコーダをサポートしていることです。したがって、ページドキュメントに含まれるプログラムスクリプトは、独自のエンコーディングを考慮するだけでなく、ブラウザエンコーダの互換性も十分に考慮する必要があります。 UNICODE をサポートしていないエンコーダを強制的に指定したブラウザでは、スクリプト コードのコメント内の中国語が正しく解析できないため、JAVASCRIPT の実行に失敗します。