Самые ранние компьютеры могли использовать только символы ASCII, но с расширением компьютерных приложений многие страны разработали специальные наборы символов для компьютеров, чтобы буквы и символы их собственных стран и наций могли отображаться и обрабатываться на компьютерах, таких как китайский GB2312. код. Позже появился Интернет, соединивший весь мир. Стало реальностью отображать языки нескольких стран и этнических групп на одном компьютере или даже в одном интерфейсе. Международные организации разработали схему кодировки символов, которая может вместить все тексты и символы в мире, под названием Unicode, что является аббревиатурой универсального набора символов и отвечает требованиям к межъязыковому и кроссплатформенному преобразованию и обработке текста. Выпущено с 1994 года. и постоянно расширялся, теперь он достиг версии 10.
Вы можете зайти на сайт https://www.unicode.org/, чтобы проверить подробную информацию, включая загрузку последней версии таблицы кодов.
При разработке веб-страницы вы можете использовать набор символов Юникода. Существуют разные способы его использования в зависимости от того, в HTML, CSS или JavaScript.
Среди них dddd представляет собой 4-значное десятичное значение, а hhhh представляет 4-значное шестнадцатеричное значение. Эти два формата имеют префиксы &# и &#x соответственно и выражаются как десятичный код или шестнадцатеричный код Unicode, оба из которых. должны предшествовать &# и &#x. Точка с запятой является суффиксом. В настоящее время символы Юникода, использующие 4-значные шестнадцатеричные коды, имеют относительно хорошую поддержку. Большинство из них могут нормально отображаться на веб-страницах, но другие символы Юникода часто не могут отображаться, поскольку используемая компьютерная платформа еще не разработана. Установите соответствующую поддержку Юникода. . Пример:
<p>Отображать символы Юникода — ∰</p>
Отображается математический символ, а код Юникода — 2230. Вы можете использовать «∰» или «∰» для вывода этого специального символа, после чего его можно будет отобразить на странице.
Символы Юникода редко используются в CSS, но иногда они используются. Обычно они представлены 4-значными шестнадцатеричными кодами Юникода с префиксом обратной косой черты.
Коды JavaScript часто используются для вывода специальных символов, таких как вывод символов температуры или угла в элементе, с использованием греческих букв, римских цифр и т. д. Вам нужно только добавить префикс «u» перед 4-значным шестнадцатеричным кодом Unicode. код. Вот и все. Пример:
document.body.innerHTML="u25D0";
В таблице геометрических фигур используется код Unicode 25D0, это круглый узор, обычно заполненный белым и наполовину заполненный черным, как половина луны.
Конечно, чаще всего китайцы используют коды Unicode с китайскими иероглифами. Чтобы отображать больше китайских иероглифов, библиотека китайских иероглифов сначала была расширена с GB2312 до GBK, а теперь до GB18030. Последняя версия GB18030 включает более 70 000 китайских символов, включая символы различных этнических меньшинств и некоторые специальные символы. Этот стандарт соответствует методу кодирования Unicode. Конечно, на некоторых компьютерах может не быть установлена полная новая версия вспомогательного программного обеспечения, поэтому часто может отображаться только часть символов.
Чтобы получить код китайского символа в Юникоде, вы можете использовать функцию JavaScript charCodeAt(), например:
вар ucode="Чжао".charCodeAt();
Таким образом, код Юникода китайского иероглифа «Чжао» сохраняется в переменной ucode, и код Юникода можно получить как 36213, который представляет собой десятичный код Юникода. Вы можете использовать метод toString(16) для преобразования этого десятичного кода в шестнадцатеричный:
var ucode="Чжао".charCodeAt().toString(16);
Таким образом получается код Unicode в шестнадцатеричной форме китайского иероглифа «Чжао», а полученное значение — 8d75.
Как правило, при выводе китайских иероглифов строка, содержащая китайские иероглифы, может отображаться напрямую. Вы также можете использовать код китайских символов Unicode для вывода соответствующих китайских символов или других символов:
String.fromCharCode(36213);
Таким образом, символ с десятичным кодом Юникода 36213 преобразуется в строку, а затем при выводе строки будет отображаться китайский иероглиф «Чжао». Поскольку китайские иероглифы можно получить напрямую с помощью метода ввода, этот метод часто используется для вывода некоторых специальных символов.
Это кодировка Unicode, процесс кодирования выглядит следующим образом:
Например, чтобы закодировать «Ян», мы можем создать новый блокнот, ввести «Ян» и выбрать сохранение в кодировке Юникода при сохранении, а затем просмотреть двоичное содержимое файла. Первые два байта FF и FE — это Юникод. метка заголовка файла кодировки и следующее. Два байта 68 и 67 представляют собой кодировку «Ян» в Юникоде. С помощью калькулятора преобразуйте ее в десятичное число, то есть 26472. Теперь вы можете написать «Ян» в файле HTML и IE. при открытии отобразится слово «Ян».
Конечно, для общих кодов ASCII кодировка Unicode соответствует кодировке ASCII, поэтому A может отображать заглавную букву «A».
Преобразование кодировки &# в символы
функция uncode(str) { return str.replace(/&#(x)?([^&]{1,5});?/g, function (a, b, c) { return String.fromCharCode(parseInt(c, b? 16: 10)); }); }
Преобразование символов в кодировку &#
функция кодирования (строка) { вар а = [], я = 0; for (; i < str.length ;) a[i] = str.charCodeAt(i ++); return "&#" + a.join(";&#") + ";"; }
На этом завершается статья о введении символов Юникода (&#, u и т. д.) на веб-страницах. Для получения дополнительной информации о Юникоде выполните поиск по предыдущим статьям на сайте downcodes.com или продолжайте просматривать соответствующие статьи ниже. в будущем мы будем поддерживать downcodes.com больше!