Os primeiros computadores só podiam usar caracteres ASCII, mas com a expansão das aplicações informáticas, muitos países conceberam conjuntos de caracteres especiais para computadores, para que as letras e caracteres dos seus próprios países e nações pudessem ser apresentados e processados em computadores, como o GB2312 da China. código. Mais tarde, surgiu a Internet, conectando o mundo inteiro. Tornou-se realidade exibir os idiomas de vários países e grupos étnicos em um computador ou mesmo em uma interface. Organizações internacionais desenvolveram um esquema de codificação de caracteres que pode acomodar todos os textos e símbolos do mundo, chamado Unicode, que é a abreviatura de Universal Character Set para atender aos requisitos de conversão e processamento de texto entre idiomas e plataformas. e continuamente expandido, atingiu agora a versão 10.
Você pode acessar o site https://www.unicode.org/ para verificar informações detalhadas, incluindo o download da versão mais recente da tabela de códigos.
Ao projetar uma página da web, você pode usar o conjunto de caracteres Unicode. Existem diferentes maneiras de usá-lo, dependendo se é HTML, CSS ou JavaScript.
Entre eles, dddd representa um valor decimal de 4 dígitos e hhhh representa um valor hexadecimal de 4 dígitos. Os dois formatos são prefixados com &# e &#x respectivamente e são expressos como código decimal ou código Unicode hexadecimal, ambos os quais. precisa ser precedido por &# e &#x. Um ponto e vírgula é um sufixo. Atualmente, os caracteres Unicode que usam códigos hexadecimais de 4 dígitos têm um suporte relativamente bom. A maioria deles pode ser exibida normalmente em páginas da web, mas outros caracteres Unicode muitas vezes não podem ser exibidos porque a plataforma de computador usada ainda não foi desenvolvida. . Exemplo:
<p>Exibir caracteres Unicode--∰</p>
Um símbolo matemático é exibido e o código Unicode é 2230. Você pode usar "∰" ou "∰" para gerar esse caractere especial e então ele pode ser exibido na página.
Caracteres Unicode raramente são usados em CSS, mas são usados ocasionalmente. Eles geralmente são representados por códigos Unicode hexadecimais de 4 dígitos, prefixados por uma barra invertida.
Os códigos JavaScript são frequentemente usados para gerar caracteres especiais, como a saída de caracteres de temperatura ou ângulo em um elemento, usando letras gregas, algarismos romanos, etc. Você só precisa adicionar o prefixo "u" na frente do Unicode hexadecimal de 4 dígitos código. É isso. Exemplo:
document.body.innerHTML="u25D0";
O código Unicode 25D0 é usado na tabela de figuras geométricas, é um padrão circular, geralmente preenchido com branco e meio preenchido com preto, como uma meia lua.
Obviamente, a ocasião mais comum para os chineses usarem códigos Unicode é com caracteres chineses. Para exibir mais caracteres chineses, a biblioteca de caracteres chineses foi expandida primeiro de GB2312 para GBK e agora para GB18030. A versão mais recente do GB18030 inclui mais de 70.000 caracteres chineses, incluindo vários caracteres de minorias étnicas e alguns caracteres especiais. Este padrão é consistente com o método de código Unicode. É claro que alguns computadores podem não ter a nova versão completa do software de suporte instalada e, muitas vezes, apenas uma parte dos caracteres pode ser exibida.
Para obter o código Unicode de um caracter chinês, você pode usar a função JavaScript charCodeAt(), por exemplo:
var ucode="Zhao".charCodeAt();
Desta forma, o código Unicode do caractere chinês "Zhao" é armazenado na variável ucode, e o código Unicode pode ser obtido como 36213, que é um código Unicode decimal. Você pode usar o método toString(16) para converter este código decimal em código hexadecimal:
var ucode="Zhao".charCodeAt().toString(16);
O que se obtém desta forma é o código Unicode na forma hexadecimal do caracter chinês "Zhao", e o valor obtido é 8d75.
Geralmente, ao gerar caracteres chineses, a string que contém caracteres chineses pode ser exibida diretamente. Você também pode usar o código Unicode de caracteres chineses para gerar os caracteres chineses correspondentes ou outros caracteres:
String.fromCharCode(36213);
Desta forma, o caractere com o código Unicode decimal 36213 é convertido em uma string e, em seguida, o caractere chinês "Zhao" será exibido quando a string for gerada. Como os caracteres chineses podem ser obtidos diretamente usando o método de entrada, esse método é frequentemente usado para gerar alguns caracteres especiais.
Esta é a codificação Unicode, o processo de codificação é assim:
Por exemplo, para codificar "Yang", podemos criar um novo bloco de notas, inserir "Yang" e optar por salvar como codificação Unicode ao salvar e, em seguida, visualizar o conteúdo binário do arquivo. Os dois primeiros bytes FF e FE são o Unicode. marca de cabeçalho do arquivo de codificação e o seguinte Os dois bytes 68 67 são a codificação unicode de "Yang". Use uma calculadora para convertê-lo em decimal, que é 26472. Agora você pode escrever "Yang" em um arquivo html e o IE será exibido. a palavra "Yang" quando é aberto.
Obviamente, para códigos ASCII gerais, a codificação Unicode é consistente com a codificação ASCII, portanto, A pode exibir uma letra maiúscula "A".
Converter a codificação &# em caracteres
função descodificar(str) { return str.replace(/&#(x)?([^&]{1,5});?/g, função (a, b, c) { retornar String.fromCharCode(parseInt(c, b? 16: 10)); }); }
Converter caracteres para codificação &#
função codificar(str) { var a = [], i = 0; for (; i < str.length ;) a[i] = str.charCodeAt(i ++); return "&#" + a.join(";&#") + ";"; }
Isso conclui este artigo sobre a introdução de caracteres Unicode (&#, u, etc.) em páginas da web. Para obter mais conteúdo Unicode relacionado, pesquise artigos anteriores em downcodes.com ou continue navegando nos artigos relacionados abaixo. apoiará mais downcodes.com no futuro!