รหัสนี้ใช้งานได้จริง ไม่มีเรื่องไร้สาระ เพียงแค่นำเสนอ
ฟังก์ชันหลักคือการตรวจสอบว่าสตริงมีอักขระภาษาจีนหรือไม่ และแทนที่ด้วย ASCLL
สตริงคงที่ส่วนตัว regEx = "[//u4e00-//u9fa5]"; /** * ตรวจสอบว่าสตริงมีอักขระจีนหรือไม่และแทนที่ด้วย ASCLL * * @param str_para * @return str_result */ สตริงคงที่ส่วนตัว isChinese_Replace( String str_para ) { รูปแบบ p = Pattern.compile( regEx ); String str_result = str_para; String str_0 = ""; str_1 = ""; สตริง str_data[] = null; สตริง str_return_reslut = ""; if ( str_result != null && str_result.trim().length() > 0 ) { ลอง { str_data = str_result.split( "" ); สำหรับ ( int i = 0; i < str_data.length; i++ ) { Matcher m = p.matcher( str_data[i] ); /* Ld(str_data[i]); */ int นับ = 0; if ( m.find() ) { count++; getBytes( "GBK" ); str_0 = จำนวนเต็มtoHexString( b[0] ); str_1 = จำนวนเต็มtoHexString( b[1] str_return_reslut = str_return_reslut + "/" + conver10( str_0 ) + conver10( str_1 ) + "/"; } อื่น ๆ { str_return_reslut = str_return_reslut + str_data[i]; ; } จับ ( UnsupportedEncodingException e ) { e.printStackTrace(); } else { return(str_return_reslut); } return(str_return_reslut); } /* การแปลงสตริงเป็นทศนิยม*/ public static int conver10( String str_0 ) { return(Integer.parseInt( str_0.substring) ( str_0.length() - 2, str_0.length() ), 16 ) }
มาดูโค้ดที่เรียบง่ายกว่าเล็กน้อยซึ่งสามารถใช้ได้ในสถานที่ที่มีความต้องการไม่สูง
นำเข้า java.util.regex.Matcher; นำเข้า java.util.regex.Pattern; การสาธิตคลาสสาธารณะ {static String regEx = "[/u4e00-/u9fa5]"; รูปแบบคงที่ pat = Pattern.compile (regEx); โมฆะคงที่สาธารณะ main (String [] args) {String input = "โลกนรก!"; System.out.println (isContainsChinese (input)); input = "hello world";System.out.println(isContainsChinese(input));} บูลีนคงที่สาธารณะ isContainsChinese(String str){Matcher matcher = pat.matcher(str);boolean flg = false;if (matcher.find()) {flg = true;} กลับ flg;}
สุดท้ายนี้ เราแนบช่วงของการเข้ารหัส Unicode สำหรับอักขระต่างๆ:
* ตัวอักษรจีน: [0x4e00,0x9fa5] (หรือทศนิยม [19968,40869])
* ตัวเลข: [0x30,0x39] (หรือทศนิยม [48, 57])
*ตัวอักษรพิมพ์เล็ก: [0x61,0x7a] (หรือทศนิยม [97, 122])
* ตัวอักษรตัวพิมพ์ใหญ่: [0x41,0x5a] (หรือทศนิยม [65, 90])