Komputer paling awal hanya dapat menggunakan karakter ASCII, namun dengan perluasan aplikasi komputer, banyak negara telah merancang rangkaian karakter khusus untuk komputer sehingga huruf dan karakter negara dan bangsa mereka sendiri dapat ditampilkan dan diproses di komputer, seperti GB2312 di Tiongkok. kode. Belakangan, Internet muncul, menghubungkan seluruh dunia. Menampilkan bahasa berbagai negara dan kelompok etnis di satu komputer atau bahkan satu antarmuka menjadi kenyataan. Organisasi internasional telah mengembangkan skema pengkodean karakter yang dapat mengakomodasi semua teks dan simbol di dunia, yang disebut Unicode, yang merupakan singkatan dari Universal Character Set untuk memenuhi persyaratan konversi dan pemrosesan teks lintas bahasa dan lintas platform dan terus diperluas, kini telah mencapai Versi 10.
Anda dapat mengunjungi situs web https://www.unicode.org/ untuk memeriksa informasi detail, termasuk mengunduh tabel kode versi terbaru.
Saat mendesain halaman web, Anda dapat menggunakan kumpulan karakter Unicode. Ada berbagai cara untuk menggunakannya bergantung pada apakah itu dalam HTML, CSS, atau JavaScript.
Diantaranya, dddd mewakili nilai desimal 4 digit, dan hhhh mewakili nilai heksadesimal 4 digit. Kedua format tersebut masing-masing diawali dengan &# dan &#x, dan dinyatakan sebagai kode desimal atau kode Unicode heksadesimal, keduanya. harus diawali dengan &# dan &#x. Saat ini, karakter Unicode yang menggunakan kode heksadesimal 4 digit memiliki dukungan yang relatif baik. Kebanyakan karakter tersebut dapat ditampilkan secara normal di halaman web, tetapi karakter Unicode lainnya seringkali tidak dapat ditampilkan karena platform komputer yang digunakan belum dikembangkan . Contoh:
<p>Menampilkan karakter Unicode--∰</p>
Simbol matematika ditampilkan, dan kode Unicode adalah 2230. Anda dapat menggunakan "∰" atau "∰" untuk menampilkan karakter khusus ini, dan kemudian dapat ditampilkan di halaman.
Karakter unicode jarang digunakan dalam CSS, tetapi kadang-kadang digunakan. Karakter tersebut biasanya diwakili oleh kode Unicode heksadesimal 4 digit, yang diawali dengan garis miring terbalik.
Kode JavaScript sering digunakan untuk mengeluarkan karakter khusus, seperti mengeluarkan karakter suhu atau sudut dalam suatu elemen, menggunakan huruf Yunani, angka Romawi, dll. Anda hanya perlu menambahkan awalan "u" di depan 4 digit Unicode heksadesimal kode. Itu saja. Contoh:
dokumen.tubuh.innerHTML="u25D0";
Kode Unicode 25D0 yang digunakan pada tabel bangun geometri berbentuk pola melingkar, biasanya diisi dengan warna putih dan setengahnya diisi dengan warna hitam, seperti setengah bulan.
Tentu saja, kesempatan paling umum bagi orang Tionghoa untuk menggunakan kode Unicode adalah dengan karakter Tionghoa. Untuk menampilkan lebih banyak karakter Tiongkok, perpustakaan karakter Tiongkok pertama kali diperluas dari GB2312 ke GBK dan sekarang ke GB18030. Versi terbaru GB18030 telah menyertakan lebih dari 70.000 karakter Cina, termasuk berbagai karakter etnis minoritas dan beberapa karakter khusus. Standar ini konsisten dengan metode kode Unicode. Tentu saja, beberapa komputer mungkin tidak menginstal perangkat lunak pendukung versi baru secara lengkap, sehingga sering kali hanya sebagian karakter yang dapat ditampilkan.
Untuk mendapatkan kode Unicode karakter Cina, Anda dapat menggunakan fungsi JavaScript charCodeAt(), misalnya:
var ucode="Zhao".charCodeAt();
Dengan cara ini, kode Unicode dari karakter Cina "Zhao" disimpan dalam variabel ucode, dan kode Unicode dapat diperoleh sebagai 36213, yang merupakan kode Unicode desimal. Anda dapat menggunakan metode toString(16) untuk mengubah kode desimal ini menjadi kode heksadesimal:
var ucode="Zhao".charCodeAt().toString(16);
Yang didapat dengan cara ini adalah kode Unicode berbentuk heksadesimal karakter Cina "Zhao", dan nilai yang didapat adalah 8d75.
Umumnya, saat mengeluarkan karakter Mandarin, string yang berisi karakter Mandarin dapat ditampilkan secara langsung. Anda juga dapat menggunakan kode Unicode karakter Tionghoa untuk menampilkan karakter Tionghoa yang sesuai atau karakter lainnya:
String.fromCharCode(36213);
Dengan cara ini, karakter dengan kode Unicode desimal 36213 diubah menjadi string, dan kemudian karakter Cina "Zhao" akan ditampilkan saat string tersebut dikeluarkan. Karena karakter Cina dapat diperoleh langsung dengan menggunakan metode input, metode ini sering digunakan untuk mengeluarkan beberapa karakter khusus.
Ini adalah pengkodean unicode, proses pengkodeannya seperti ini:
Misalnya, untuk mengkodekan "Yang", kita dapat membuat notepad baru, memasukkan "Yang" dan memilih untuk menyimpan sebagai pengkodean unicode saat menyimpan, lalu melihat konten biner dari file tersebut pengkodean tanda header file, dan berikut ini Dua byte 68 dan 67 adalah pengkodean Unicode "Yang". Gunakan kalkulator untuk mengubahnya menjadi desimal, yaitu 26472. Sekarang Anda dapat menulis "Yang" dalam file HTML, dan IE akan menampilkan kata "Yang" saat dibuka.
Tentu saja, untuk kode ASCII umum, pengkodean unicode konsisten dengan pengkodean ASCII, sehingga A dapat menampilkan huruf kapital "A".
Ubah &# pengkodean menjadi karakter
fungsi uncode(str) { return str.replace(/&#(x)?([^&]{1,5});?/g, function (a, b, c) { return String.fromCharCode(parseInt(c, b ? 16 : 10)); }); }
Ubah karakter menjadi & pengkodean
penyandian fungsi(str) { var a = [], saya = 0; untuk (; saya < str.panjang ;) a[i] = str.charCodeAt(i ++); kembalikan "&#" + a.join(";&#") + ";"; }
Sekianlah artikel tentang pengenalan karakter Unicode (&#, u, dll.) di halaman web. Untuk konten Unicode terkait lainnya, silakan cari artikel sebelumnya di downcodes.com atau lanjutkan menelusuri artikel terkait di bawah akan lebih mendukung downcodes.com di masa mendatang!