Gramática básica de JAVASCRIPT - Conjunto de caracteres
1: El conjunto de caracteres,
el habla, por simple o complejo que sea, siempre está compuesto por símbolos. La colección de símbolos que constituye un idioma es el "conjunto de caracteres" de este idioma. El conjunto de caracteres chinos consta de 26 letras mayúsculas y 26 letras minúsculas más varios signos de puntuación. Cada carácter chino puede considerarse como un "carácter".
En el campo de la informática, un conjunto de caracteres generalmente se refiere al conjunto completo de caracteres. que constituyen un texto de forma codificada. Por lo tanto, el juego de caracteres de JAVASCRIPT se refiere al conjunto de rangos de caracteres legales que constituyen el programa JAVASCRIPT [1]
Los juegos de caracteres estándar comunes incluyen ASCLL, ISO, LATIN-1, GBK y UNICODE. Entre ellos, ASCLL es un conjunto de caracteres de codificación de 7 bits, que básicamente solo se aplica al inglés. ISO-LATIN-1 de 8 bits admite la mayoría de los idiomas latinos, mientras que GBK y UNICODE de codificación de 16 bits son totalmente compatibles con los idiomas del chino oriental. Idioma.
En los estándares anteriores a ECMASCRIPTV3, la instrucción JAVASCRIPT en sí admitía el juego de caracteres ASCLL, pero aún se permitía que el juego de caracteres UNICODE apareciera en comentarios o literales de cadena de juego de caracteres entre comillas, y podía ser procesado correctamente por analizadores que admitieran UMICODE.
Una cosa a tener en cuenta sobre los juegos de caracteres es que los navegadores suelen admitir varios tipos de codificadores. Por lo tanto, como script de programa que cae en un documento de página, no solo debe considerar su propia codificación, sino también considerar completamente la compatibilidad del codificador del navegador. Para los navegadores que especifican a la fuerza un codificador que no admite UNICODE, JAVASCRIPT no se ejecutará porque el chino en los comentarios del código del script no se puede analizar correctamente.