คอมพิวเตอร์รุ่นแรกๆ สามารถใช้อักขระ ASCII ได้เท่านั้น แต่ด้วยการขยายตัวของแอปพลิเคชันคอมพิวเตอร์ หลายประเทศได้ออกแบบชุดอักขระพิเศษสำหรับคอมพิวเตอร์เพื่อให้สามารถแสดงและประมวลผลตัวอักษรและอักขระของประเทศและประเทศของตนบนคอมพิวเตอร์ เช่น GB2312 ของจีน รหัส. ต่อมาอินเทอร์เน็ตก็ปรากฏขึ้นเพื่อเชื่อมโยงคนทั้งโลกเข้าด้วยกัน การแสดงภาษาของหลายประเทศและกลุ่มชาติพันธุ์บนคอมพิวเตอร์เครื่องเดียวหรือแม้แต่อินเทอร์เฟซเดียวก็กลายเป็นความจริง องค์กรระหว่างประเทศได้พัฒนารูปแบบการเข้ารหัสอักขระที่สามารถรองรับข้อความและสัญลักษณ์ทั้งหมดในโลกที่เรียกว่า Unicode ซึ่งเป็นตัวย่อของชุดอักขระสากลเพื่อให้เป็นไปตามข้อกำหนดสำหรับการแปลงและประมวลผลข้อความข้ามภาษาและข้ามแพลตฟอร์มตั้งแต่ปี 1994 เปิดตัว และขยายอย่างต่อเนื่องจนมาถึงเวอร์ชัน 10 แล้ว
คุณสามารถไปที่เว็บไซต์ https://www.unicode.org/ เพื่อตรวจสอบข้อมูลโดยละเอียด รวมถึงการดาวน์โหลดตารางโค้ดเวอร์ชันล่าสุด
เมื่อออกแบบหน้าเว็บ คุณสามารถใช้ชุดอักขระ Unicode ได้หลายวิธี ขึ้นอยู่กับว่าเป็นชุดอักขระ HTML, CSS หรือ JavaScript
ในบรรดารูปแบบเหล่านั้น dddd แทนค่าทศนิยม 4 หลัก และ hhhh แทนค่าเลขฐานสิบหก 4 หลัก ทั้งสองรูปแบบขึ้นต้นด้วย &# และ &#x ตามลำดับ และแสดงเป็นรหัสทศนิยมหรือรหัส Unicode เลขฐานสิบหก ซึ่งทั้งสองรูปแบบ ต้องนำหน้าด้วย &# และ &#x ปัจจุบันอักขระ Unicode ที่ใช้รหัสเลขฐานสิบหก 4 หลักได้รับการสนับสนุนค่อนข้างดี ส่วนใหญ่สามารถแสดงได้ตามปกติบนหน้าเว็บ แต่อักขระ Unicode อื่นๆ มักจะไม่สามารถแสดงได้เนื่องจากแพลตฟอร์มคอมพิวเตอร์ที่ใช้ยังไม่ได้รับการพัฒนา ติดตั้งการรองรับ Unicode ที่เกี่ยวข้อง . ตัวอย่าง:
<p>แสดงอักขระ Unicode--∰</p>
สัญลักษณ์ทางคณิตศาสตร์ปรากฏขึ้น และรหัส Unicode คือ 2230 คุณสามารถใช้ "∰" หรือ "∰" เพื่อส่งออกอักขระพิเศษนี้ จากนั้นจึงสามารถแสดงบนหน้าเว็บได้
อักขระ Unicode ไม่ค่อยมีการใช้ใน CSS แต่บางครั้งจะใช้แทนด้วยรหัส Unicode เลขฐานสิบหก 4 หลัก นำหน้าด้วยเครื่องหมายแบ็กสแลช
โค้ด JavaScript มักใช้เพื่อแสดงอักขระพิเศษ เช่น อักขระอุณหภูมิหรือมุมในองค์ประกอบ โดยใช้ตัวอักษรกรีก เลขโรมัน ฯลฯ คุณเพียงแค่ต้องเพิ่มคำนำหน้า "u" หน้าเลขฐานสิบหก Unicode 4 หลักเท่านั้น รหัส แค่นั้นแหละ. ตัวอย่าง:
document.body.innerHTML="u25D0";
มีการใช้โค้ด Unicode 25D0 ในตารางรูปทรงเรขาคณิต มีลักษณะเป็นรูปวงกลม มักเต็มไปด้วยสีขาวและครึ่งหนึ่งเต็มไปด้วยสีดำ คล้ายพระจันทร์ครึ่งเสี้ยว
แน่นอนว่าโอกาสที่คนจีนจะใช้โค้ด Unicode บ่อยที่สุดคือการใช้ตัวอักษรจีน เพื่อที่จะแสดงตัวอักษรจีนได้มากขึ้น ในตอนแรกไลบรารีตัวอักษรจีนจึงขยายจาก GB2312 เป็น GBK และตอนนี้เป็น GB18030 GB18030 เวอร์ชันล่าสุดมีอักขระภาษาจีนมากกว่า 70,000 ตัว รวมถึงอักขระชนกลุ่มน้อยและอักขระพิเศษบางตัว มาตรฐานนี้สอดคล้องกับวิธีโค้ด Unicode แน่นอนว่าคอมพิวเตอร์บางเครื่องอาจไม่ได้ติดตั้งซอฟต์แวร์สนับสนุนเวอร์ชันใหม่ที่สมบูรณ์ ดังนั้นบ่อยครั้งจึงสามารถแสดงได้เพียงบางส่วนของตัวอักษรเท่านั้น
เพื่อให้ได้โค้ด Unicode ของตัวอักษรจีน คุณสามารถใช้ฟังก์ชัน JavaScript charCodeAt() ได้ เช่น:
var ucode="Zhao".charCodeAt();
ด้วยวิธีนี้ รหัส Unicode ของตัวอักษรจีน "Zhao" จะถูกเก็บไว้ในตัวแปร ucode และสามารถรับรหัส Unicode ได้เป็น 36213 ซึ่งเป็นรหัส Unicode ทศนิยม คุณสามารถใช้เมธอด toString(16) เพื่อแปลงรหัสทศนิยมนี้เป็นรหัสฐานสิบหก:
var ucode="Zhao".charCodeAt().toString(16);
สิ่งที่ได้รับในลักษณะนี้คือรหัส Unicode ในรูปแบบเลขฐานสิบหกของตัวอักษรจีน "Zhao" และค่าที่ได้รับคือ 8d75
โดยทั่วไป เมื่อส่งออกอักขระภาษาจีน สตริงที่มีอักขระภาษาจีนสามารถแสดงได้โดยตรง คุณยังสามารถใช้โค้ด Unicode ของอักขระภาษาจีนเพื่อส่งออกอักขระจีนหรืออักขระอื่นๆ ที่เกี่ยวข้องได้:
String.fromCharCode(36213);
ด้วยวิธีนี้ อักขระที่มีรหัส Unicode ทศนิยม 36213 จะถูกแปลงเป็นสตริง จากนั้นอักขระจีน "Zhao" จะปรากฏขึ้นเมื่อมีการส่งออกสตริง เนื่องจากสามารถรับอักขระภาษาจีนได้โดยตรงโดยใช้วิธีการป้อนข้อมูล จึงมักใช้วิธีนี้เพื่อส่งออกอักขระพิเศษบางตัว
นี่คือการเข้ารหัส Unicode กระบวนการเข้ารหัสมีลักษณะดังนี้:
ตัวอย่างเช่น ในการเข้ารหัส "Yang" เราสามารถสร้างสมุดบันทึกใหม่ ป้อน "Yang" และเลือกที่จะบันทึกเป็นการเข้ารหัส Unicode เมื่อบันทึก จากนั้นจึงดูเนื้อหาไบนารีของไฟล์ สองไบต์แรก FF และ FE คือ Unicode เครื่องหมายส่วนหัวของไฟล์เข้ารหัสและต่อไปนี้สองไบต์ 68 67 เป็นการเข้ารหัส Unicode ของ "Yang" ใช้เครื่องคิดเลขเพื่อแปลงเป็นทศนิยมซึ่งก็คือ 26472 ตอนนี้คุณสามารถเขียน "Yang" ในไฟล์ html แล้ว IE จะแสดง คำว่า “หยาง” เมื่อเปิดออก
แน่นอนว่า สำหรับโค้ด ASCII ทั่วไป การเข้ารหัส Unicode จะสอดคล้องกับการเข้ารหัส ASCII ดังนั้น A จึงสามารถแสดงอักษรตัวใหญ่ "A" ได้
แปลงการเข้ารหัสเป็นอักขระ
ฟังก์ชั่นถอดรหัส (str) { return str.replace(/&#(x)?([^&]{1,5});?/g, ฟังก์ชัน (a, b, c) { กลับ String.fromCharCode(parseInt(c, b ? 16 : 10)); - -
แปลงอักขระเป็น 'การเข้ารหัส
ฟังก์ชั่นเข้ารหัส (str) { var a = [], i = 0; สำหรับ (; i < str.length ;) a[i] = str.charCodeAt(i ++); กลับ "&#" + a.join(";&#") + ";"; -
นี่เป็นการสรุปบทความนี้เกี่ยวกับการแนะนำอักขระ Unicode (&#, u ฯลฯ) ในหน้าเว็บ สำหรับเนื้อหา Unicode ที่เกี่ยวข้องเพิ่มเติม โปรดค้นหาบทความก่อนหน้าใน downcodes.com หรือเรียกดูบทความที่เกี่ยวข้องด้านล่างต่อไป จะสนับสนุน downcodes.com มากขึ้นในอนาคต!