ไวยากรณ์พื้นฐานของ JAVASCRIPT - ชุดอักขระ
1: ชุดอักขระ
คำพูด ไม่ว่าจะเรียบง่ายหรือซับซ้อนเพียงใด คอลเลกชันของสัญลักษณ์ที่ประกอบขึ้นเป็นภาษาคือ "ชุดอักขระ" ของภาษานี้ ตัวอักษรจีนตัวพิมพ์ใหญ่ 26 ตัวและตัวพิมพ์เล็ก 26 ตัวบวกกับเครื่องหมายวรรคตอนหลายตัวนั้นซับซ้อนกว่า
มาก ที่ประกอบเป็นข้อความในลักษณะที่เข้ารหัส ดังนั้น ชุดอักขระของ JAVASCRIPT จึงอ้างอิงถึงชุดของช่วงอักขระตามกฎหมายที่ประกอบขึ้นเป็นโปรแกรม JAVASCRIPT [1]
ชุดอักขระมาตรฐานทั่วไป ได้แก่ ASCLL, ISO, LATIN-1, GBK และ UNICODE ในหมู่พวกเขา ASCLL เป็นชุดอักขระการเข้ารหัส 7 บิต ซึ่งโดยพื้นฐานแล้วใช้ได้กับภาษาอังกฤษเท่านั้น ISO-LATIN-1 8 บิตรองรับภาษาละตินส่วนใหญ่ ในขณะที่การเข้ารหัส GBK และ UNICODE แบบ 16 บิตรองรับภาษาจีนตะวันออกอย่างสมบูรณ์ ภาษา.
ในมาตรฐานก่อน ECMASCRIPTV3 คำสั่ง JAVASCRIPT รองรับชุดอักขระ ASCLL แต่ชุดอักขระ UNICODE ยังคงได้รับอนุญาตให้ปรากฏในความคิดเห็นหรือตัวอักษรสตริงชุดอักขระที่อยู่ในเครื่องหมายคำพูด และสามารถประมวลผลได้อย่างถูกต้องโดย parsers ที่สนับสนุน UMICODE
สิ่งหนึ่งที่ควรทราบเกี่ยวกับชุดอักขระก็คือ โดยทั่วไปแล้วเบราว์เซอร์จะรองรับตัวเข้ารหัสหลายประเภทด้วย ดังนั้นในฐานะที่เป็นสคริปต์โปรแกรมที่อยู่ในเอกสารหน้า จะต้องไม่เพียงแต่พิจารณาการเข้ารหัสของตัวเองเท่านั้น แต่ยังต้องพิจารณาความเข้ากันได้ของตัวเข้ารหัสของเบราว์เซอร์ด้วย สำหรับเบราว์เซอร์ที่บังคับระบุตัวเข้ารหัสที่ไม่รองรับ UNICODE JAVASCRIPT จะไม่สามารถดำเนินการได้เนื่องจากภาษาจีนในความคิดเห็นของโค้ดสคริปต์ไม่สามารถแยกวิเคราะห์ได้อย่างถูกต้อง