Tata bahasa dasar JAVASCRIPT - Kumpulan karakter
1: Kumpulan karakter,
ucapan, tidak peduli seberapa sederhana atau rumitnya, selalu terdiri dari simbol. Kumpulan simbol yang membentuk suatu bahasa adalah "kumpulan karakter" dari bahasa Inggris dari 26 huruf besar dan 26 huruf kecil ditambah beberapa tanda baca. Kumpulan karakter Cina jauh lebih rumit. Setiap karakter Cina dapat dianggap sebagai "karakter".
Di bidang komputer, karakter Satu set biasanya mengacu pada kumpulan karakter yang lengkap yang merupakan teks dengan cara yang dikodekan. Oleh karena itu, kumpulan karakter JAVASCRIPT mengacu pada kumpulan rentang karakter legal yang membentuk program JAVASCRIPT [1]
Kumpulan karakter standar umum mencakup ASCLL, ISO, LATIN-1, GBK, dan UNICODE. Diantaranya, ASCLL adalah kumpulan karakter pengkodean 7-bit, yang pada dasarnya hanya berlaku untuk bahasa Inggris. ISO-LATIN-1 8-bit mendukung sebagian besar bahasa Latin, sedangkan pengkodean 16-bit GBK dan UNICODE sepenuhnya mendukung bahasa Cina Timur. Bahasa.
Dalam standar sebelum ECMASCRIPTV3, instruksi JAVASCRIPT sendiri mendukung kumpulan karakter ASCLL, tetapi kumpulan karakter UNICODE masih diizinkan untuk muncul dalam komentar atau literal string kumpulan karakter yang diapit tanda kutip, dan dapat diproses dengan benar oleh parser yang mendukung UMICODE.
Satu hal yang perlu diperhatikan tentang rangkaian karakter adalah bahwa browser biasanya mendukung beberapa jenis encoder itu sendiri. Oleh karena itu, sebagai skrip program yang dimasukkan ke dalam dokumen halaman, ia tidak hanya harus mempertimbangkan pengkodeannya sendiri, tetapi juga sepenuhnya mempertimbangkan kompatibilitas encoder browser. Untuk browser yang secara paksa menentukan encoder yang tidak mendukung UNICODE, JAVASCRIPT akan gagal dijalankan karena bahasa Mandarin di komentar kode skrip tidak dapat diurai dengan benar.