/*From:http://blog.joycode.com/hopeq/archive/2005/09/26/64146.aspx*/
Ada proyek Web. Tentu saja, jika pengkodean proyek menggunakan UTF-8, tidak akan ada masalah, tetapi proyek ini adalah proyek lama. Hanya pindah pada otak halaman ini.
Setelah penelitian, ditemukan bahwa masalah ini dapat diselesaikan dengan metode entitas HTML.
Untuk entitas HTML, silakan merujuk ke:
Referensi entitas karakter dalam html 4
HTML Document Replicevity
Kode Uji:
byte [] bcomments = encoding.utf8.getbytes ("ich ブ ル ル ???? cina");
char [] ccomments = encoding.utf8.getchars (bcomments);
StringBuilder charbuilder = stringBuilder baru ();
Foreach (char c in comments)
{{
if (c> '/u0800'))
{{
charbuilder.append ("&#");
charbuilder.append ((int) c);
}
kalau tidak
{{
charbuilder.Perampangan (c);
}
}
response.write (charbuilder.tostring ());
Peran kode ini adalah untuk menghasilkan semua karakter Cina, Korea, dan Jepang ke dalam entitas HTML melalui pengkodean keras. Entitas HTML tidak terpengaruh oleh set Refonsencoding dan Page Coding.
menjelaskan:
/U0800 di atas adalah karakter Cina, Korea, dan Jepang.
Lingkup Cina:/U4E00-/U9FA5, Jepang di/U0800-/U4E00, dan Korea di atas/U9FA5.
Metode ini hanya untuk menyelesaikan masalah skala kecil.