Les premiers ordinateurs ne pouvaient utiliser que des caractères ASCII, mais avec l'expansion des applications informatiques, de nombreux pays ont conçu des jeux de caractères spéciaux pour les ordinateurs afin que les lettres et les caractères de leurs propres pays et nations puissent être affichés et traités sur des ordinateurs, comme le GB2312 de Chine. code. Plus tard, Internet est apparu, connectant le monde entier. Il est devenu une réalité d'afficher les langues de plusieurs pays et groupes ethniques sur un seul ordinateur ou même une seule interface. Les organisations internationales ont développé un système de codage de caractères capable de prendre en charge tous les textes et symboles du monde, appelé Unicode, qui est l'abréviation de Universal Character Set pour répondre aux exigences de conversion et de traitement de texte multilingue et multiplateforme. et continuellement enrichi, il atteint désormais la version 10.
Vous pouvez accéder au site Web https://www.unicode.org/ pour vérifier des informations détaillées, notamment en téléchargeant la dernière version de la table de codes.
Lors de la conception d'une page Web, vous pouvez utiliser le jeu de caractères Unicode. Il existe différentes manières de l'utiliser selon qu'elle est en HTML, CSS ou JavaScript.
Parmi eux, dddd représente une valeur décimale à 4 chiffres et hhhh représente une valeur hexadécimale à 4 chiffres. Les deux formats sont préfixés respectivement par &# et &#x, et sont exprimés sous forme de code décimal ou de code Unicode hexadécimal, tous deux. doit être précédé de &# et &#x. Un point-virgule est un suffixe. À l'heure actuelle, les caractères Unicode utilisant des codes hexadécimaux à 4 chiffres sont relativement bien pris en charge. La plupart d'entre eux peuvent être affichés normalement sur les pages Web, mais d'autres caractères Unicode ne peuvent souvent pas être affichés car la plate-forme informatique utilisée n'a pas encore été développée. . Exemple:
<p>Afficher les caractères Unicode--∰</p>
Un symbole mathématique s'affiche et le code Unicode est 2230. Vous pouvez utiliser "∰" ou "∰" pour afficher ce caractère spécial, puis il peut être affiché sur la page.
Les caractères Unicode sont rarement utilisés en CSS, mais ils le sont occasionnellement. Ils sont généralement représentés par des codes Unicode hexadécimaux à 4 chiffres, préfixés par une barre oblique inverse.
Les codes JavaScript sont souvent utilisés pour afficher des caractères spéciaux, tels que l'affichage de caractères de température ou d'angle dans un élément, en utilisant des lettres grecques, des chiffres romains, etc. Il vous suffit d'ajouter le préfixe "u" devant l'hexadécimal Unicode à 4 chiffres. code. C'est tout. Exemple:
document.body.innerHTML="u25D0";
Le code Unicode 25D0 est utilisé dans le tableau des figures géométriques, il s'agit d'un motif circulaire, généralement rempli de blanc et à moitié rempli de noir, comme une demi-lune.
Bien entendu, l’occasion la plus courante pour les Chinois d’utiliser les codes Unicode est celle des caractères chinois. Afin d'afficher davantage de caractères chinois, la bibliothèque de caractères chinois a d'abord été étendue de GB2312 à GBK et maintenant à GB18030. La dernière version du GB18030 inclut plus de 70 000 caractères chinois, dont divers caractères de minorités ethniques et certains caractères spéciaux. Cette norme est cohérente avec la méthode du code Unicode. Bien entendu, certains ordinateurs peuvent ne pas disposer de la nouvelle version complète du logiciel de support, si bien que souvent seule une partie des caractères peut être affichée.
Afin d'obtenir le code Unicode d'un caractère chinois, vous pouvez utiliser la fonction JavaScript charCodeAt(), par exemple :
var ucode="Zhao".charCodeAt();
De cette façon, le code Unicode du caractère chinois « Zhao » est stocké dans la variable ucode, et le code Unicode peut être obtenu sous la forme 36213, qui est un code Unicode décimal. Vous pouvez utiliser la méthode toString(16) pour convertir ce code décimal en code hexadécimal :
var ucode="Zhao".charCodeAt().toString(16);
On obtient ainsi le code Unicode sous la forme hexadécimale du caractère chinois « Zhao », et la valeur obtenue est 8d75.
Généralement, lors de la sortie de caractères chinois, la chaîne contenant les caractères chinois peut être affichée directement. Vous pouvez également utiliser le code Unicode des caractères chinois pour afficher les caractères chinois ou d'autres caractères correspondants :
String.fromCharCode(36213);
De cette façon, le caractère avec le code Unicode décimal 36213 est converti en chaîne, puis le caractère chinois « Zhao » sera affiché lors de la sortie de la chaîne. Étant donné que les caractères chinois peuvent être obtenus directement en utilisant la méthode de saisie, cette méthode est souvent utilisée pour générer certains caractères spéciaux.
Il s'agit d'un encodage Unicode, le processus d'encodage est le suivant :
Par exemple, pour encoder "Yang", nous pouvons créer un nouveau bloc-notes, saisir "Yang" et choisir d'enregistrer en codage Unicode lors de l'enregistrement, puis afficher le contenu binaire du fichier. Les deux premiers octets FF et FE sont l'unicode. marque d'en-tête du fichier de codage, et ce qui suit. Les deux octets 68 67 sont le codage Unicode de "Yang". Utilisez une calculatrice pour le convertir en décimal qui est 26472. Vous pouvez maintenant écrire "Yang" dans un fichier HTML et IE l'affichera. le mot « Yang » lorsqu'il est ouvert.
Bien entendu, pour les codes ASCII généraux, le codage Unicode est cohérent avec le codage ASCII, donc A peut afficher une lettre majuscule « A ».
Convertir l'encodage &# en caractères
fonction uncode(str) { return str.replace(/&#(x)?([^&]{1,5});?/g, function (a, b, c) { return String.fromCharCode(parseInt(c, b ? 16 : 10)); }); }
Convertir les caractères en encodage &#
fonction encoder(str) { var une = [], je = 0; pour (; i < str.length ;) a[i] = str.charCodeAt(i ++); return "&#" + a.join(";&#") + ";"; }
Ceci conclut cet article sur l'introduction des caractères Unicode (&#, u, etc.) dans les pages Web. Pour plus de contenu Unicode connexe, veuillez rechercher les articles précédents sur downcodes.com ou continuer à parcourir les articles connexes ci-dessous. soutiendra davantage downcodes.com à l'avenir !