Gramática básica do JAVASCRIPT - Conjunto de caracteres
1: Conjunto de caracteres,
a fala, por mais simples ou complexa que seja, é sempre composta por símbolos. A coleção de símbolos que constituem um idioma é o “conjunto de caracteres” deste idioma inglês. de 26 letras maiúsculas e 26 letras minúsculas, além de vários sinais de pontuação. O conjunto de caracteres chineses é muito mais complicado. Cada caractere chinês pode ser considerado um "caractere".
No campo da informática, um conjunto de caracteres geralmente se refere ao conjunto completo de caracteres. que constituem um texto de forma codificada. Portanto, o conjunto de caracteres de JAVASCRIPT refere-se ao conjunto de intervalos de caracteres legais que constituem o programa JAVASCRIPT [1].
Conjuntos de caracteres padrão comuns incluem ASCLL, ISO, LATIN-1, GBK e UNICODE. Entre eles, ASCLL é um conjunto de caracteres de codificação de 7 bits, que é basicamente aplicável apenas ao inglês. O ISO-LATIN-1 de 8 bits suporta a maioria dos idiomas latinos, enquanto a codificação GBK e UNICODE de 16 bits oferece suporte total aos idiomas do chinês oriental. Linguagem.
Nos padrões anteriores ao ECMASCRIPTV3, a própria instrução JAVASCRIPT suportava o conjunto de caracteres ASCLL, mas o conjunto de caracteres UNICODE ainda tinha permissão para aparecer em comentários ou literais de cadeia de caracteres do conjunto de caracteres entre aspas e poderia ser processado corretamente por analisadores que suportam UMICODE.
Uma coisa a ser observada sobre os conjuntos de caracteres é que os próprios navegadores normalmente suportam vários tipos de codificadores. Portanto, como um script de programa que cai em um documento de página, ele não deve apenas considerar sua própria codificação, mas também considerar totalmente a compatibilidade do codificador do navegador. Para navegadores que especificam forçosamente um codificador que não suporta UNICODE, o JAVASCRIPT não será executado porque o chinês nos comentários do código do script não pode ser analisado corretamente.