Las primeras computadoras solo podían usar caracteres ASCII, pero con la expansión de las aplicaciones informáticas, muchos países han diseñado conjuntos de caracteres especiales para computadoras para que las letras y caracteres de sus propios países y naciones puedan visualizarse y procesarse en computadoras, como el GB2312 de China. código. Más tarde apareció Internet, que conecta al mundo entero. Se hizo realidad mostrar los idiomas de múltiples países y grupos étnicos en una computadora o incluso en una interfaz. Las organizaciones internacionales han desarrollado un esquema de codificación de caracteres que puede acomodar todos los textos y símbolos del mundo, llamado Unicode, que es la abreviatura de Universal Character Set para cumplir con los requisitos de conversión y procesamiento de texto en varios idiomas y plataformas desde 1994. y ampliado continuamente, ahora ha llegado a la Versión 10.
Puede ir al sitio web https://www.unicode.org/ para consultar información detallada, incluida la descarga de la última versión de la tabla de códigos.
Al diseñar una página web, puedes utilizar el juego de caracteres Unicode. Hay diferentes formas de utilizarlo dependiendo de si está en HTML, CSS o JavaScript.
Entre ellos, dddd representa un valor decimal de 4 dígitos y hhhh representa un valor hexadecimal de 4 dígitos. Los dos formatos tienen el prefijo &# y &#x respectivamente y se expresan como código decimal o código Unicode hexadecimal. debe ir precedido de &# y &#x. Un punto y coma es un sufijo. En la actualidad, los caracteres Unicode que utilizan códigos hexadecimales de 4 dígitos tienen un soporte relativamente bueno. La mayoría de ellos se pueden mostrar normalmente en páginas web, pero otros caracteres Unicode a menudo no se pueden mostrar porque la plataforma informática utilizada aún no se ha desarrollado. . Ejemplo:
<p>Mostrar caracteres Unicode--∰</p>
Se muestra un símbolo matemático y el código Unicode es 2230. Puede utilizar "∰" o "∰" para generar este carácter especial y luego podrá mostrarse en la página.
Los caracteres Unicode rara vez se usan en CSS, pero se usan ocasionalmente. Generalmente están representados por códigos Unicode hexadecimales de 4 dígitos, precedidos por una barra invertida.
Los códigos JavaScript se utilizan a menudo para generar caracteres especiales, como generar caracteres de temperatura o ángulo en un elemento, usar letras griegas, números romanos, etc. Solo necesita agregar el prefijo "u" delante del hexadecimal Unicode de 4 dígitos. código Eso es todo. Ejemplo:
document.body.innerHTML="u25D0";
En la tabla de figuras geométricas se utiliza el código Unicode 25D0, que es un patrón circular, generalmente relleno de blanco y medio relleno de negro, como media luna.
Por supuesto, la ocasión más común para que los chinos utilicen códigos Unicode es con caracteres chinos. Para mostrar más caracteres chinos, la biblioteca de caracteres chinos se amplió primero de GB2312 a GBK y ahora a GB18030. La última versión de GB18030 incluye más de 70.000 caracteres chinos, incluidos varios caracteres de minorías étnicas y algunos caracteres especiales. Este estándar es coherente con el método de código Unicode. Por supuesto, es posible que algunas computadoras no tengan instalada la nueva versión completa del software de soporte, por lo que a menudo solo se puede mostrar una parte de los caracteres.
Para obtener el código Unicode de un carácter chino, puedes utilizar la función JavaScript charCodeAt(), por ejemplo:
var ucode="Zhao".charCodeAt();
De esta forma, el código Unicode del carácter chino "Zhao" se almacena en la variable ucode, y el código Unicode se puede obtener como 36213, que es un código Unicode decimal. Puede utilizar el método toString(16) para convertir este código decimal a código hexadecimal:
var ucode="Zhao".charCodeAt().toString(16);
Lo que se obtiene de esta forma es el código Unicode en forma hexadecimal del carácter chino "Zhao", y el valor obtenido es 8d75.
Generalmente, al generar caracteres chinos, la cadena que contiene caracteres chinos se puede mostrar directamente. También puede utilizar el código Unicode de caracteres chinos para generar los caracteres chinos correspondientes u otros caracteres:
String.fromCharCode(36213);
De esta manera, el carácter con el código Unicode decimal 36213 se convierte en una cadena, y luego se mostrará el carácter chino "Zhao" cuando se genere la cadena. Debido a que los caracteres chinos se pueden obtener directamente mediante el método de entrada, este método se utiliza a menudo para generar algunos caracteres especiales.
Esta es la codificación Unicode, el proceso de codificación es así:
Por ejemplo, para codificar "Yang", podemos crear un nuevo bloc de notas, ingresar "Yang" y elegir guardar como codificación Unicode al guardar, y luego ver el contenido binario del archivo. Los primeros dos bytes FF y FE son Unicode. marca de encabezado del archivo de codificación, y lo siguiente Los dos bytes 68 67 son la codificación Unicode de "Yang". Use una calculadora para convertirlo a decimal, que es 26472. Ahora puede escribir "Yang" en un archivo html y IE lo mostrará. la palabra "Yang" cuando se abre.
Por supuesto, para los códigos ASCII generales, la codificación Unicode es consistente con la codificación ASCII, por lo que A puede mostrar una letra "A" mayúscula.
Convertir la codificación &# en caracteres
función decodificar (cadena) { return str.replace(/&#(x)?([^&]{1,5});?/g, función (a, b, c) { return String.fromCharCode(parseInt(c, b? 16: 10)); }); }
Convertir caracteres a codificación &#
función codificar (cadena) { var a = [], i = 0; para (; i < str.length ;) a[i] = str.charCodeAt(i ++); devolver "&#" + a.join(";&#") + ";"; }
Con esto concluye este artículo sobre la introducción de caracteres Unicode (&#, u, etc.) en páginas web. Para obtener más contenido Unicode relacionado, busque artículos anteriores en downcodes.com o continúe navegando por los artículos relacionados a continuación. ¡Soportará más downcodes.com en el futuro!