/* From:http://blog.joycode.com/hopeq/archive/2005/09/26/64146.aspx*/
Es gibt ein Webprojekt. Wenn die Codierung des Projekts UTF-8 verwendet, wird es natürlich kein Problem geben, aber dieses Projekt ist ein altes Projekt. Bewegen Sie sich nur auf dieser Seite Gehirn.
Nach der Forschung wurde festgestellt, dass dieses Problem durch die HTML -Entitätsmethode gelöst werden kann.
Für HTML -Unternehmen finden Sie unter:
Charakterentität Referenzen in HTML 4
HTML -Dokument Ersatz
Testcode:
byte [] bComponMents = coding.utf8.getBytes ("Ich ist ブ ル ???? chinesisch");
char [] ccompotions = coding.utf8.getchars (bComputer);
StringBuilder charbuilder = new StringBuilder ();
Foreach (char c in compoments)
{{{{
if (c> '/u0800')))
{{{{
charbuilder.append ("&#");
Charbuilder.Append ((int) c);
}
anders
{{{{
Charbuilder.Append (c);
}
}
response.write (charbuilder.tostring ());
Die Rolle dieses Code besteht darin, alle chinesischen, koreanischen und japanischen Zeichen in HTML -Entitäten durch harte Codierung auszugeben. Die HTML -Entität ist nicht vom RefonsenScoding- und Seitencodierungssatz betroffen.
veranschaulichen:
/U0800 oben sind chinesische, koreanische und japanische Charaktere.
Umfang der Chinesen:/u4e00-/u9fa5, japanische in/u0800-/u4e00 und Koreaner ist über/u9fa5.
Diese Methode ist nur, um das kleine Problem zu lösen.