Kodenya sangat praktis, bukan omong kosong di sini, cukup tunjukkan saja
Fungsi utamanya adalah untuk menentukan apakah suatu string berisi karakter Cina dan menggantinya dengan ASCLL
private static String regEx = "[//u4e00-//u9fa5]"; /** * Tentukan apakah string berisi karakter Cina dan ganti dengan ASCLL * * @param str_para * @return str_result */ private static String isChinese_Replace( String str_para ) { Pola p = Pola.kompilasi(regEx ); String str_result = str_para; String str_0 = ""; str_1 = ""; String str_data[] = null; String str_return_reslut = ""; jika ( str_result != null && str_result.trim().length() > 0 ) { coba { str_data = str_result.split( "" ); for ( int i = 0; i < str_data.length; i++ ) { Pencocokan m = p.pencocokan( str_data[i] ); /* Ld(str_data[i]); */ int hitungan = 0; jika ( m.find() ) { hitungan++; getBytes( "GBK" ); str_0 = Integer.toHexString( b[0] ); ); str_return_reslut = str_return_reslut + "/" + conver10( str_0 ) + conver10( str_1 ) + "/"; } else { str_return_reslut = str_return_reslut + str_data[i]; ; } tangkapan ( UnsupportedEncodingException e ) { e.printStackTrace(); } } else { return(str_return_reslut); } return(str_return_reslut); } /* Konversi string ke desimal*/ public static int conver10( String str_0 ) { return(Integer.parseInt( str_0.substring) ( str_0.panjang() - 2, str_0.panjang() ), 16 ) }
Mari kita lihat kode yang sedikit lebih sederhana yang dapat digunakan di tempat yang permintaannya tidak tinggi.
import java.util.regex.Matcher;import java.util.regex.Pattern; demo kelas publik {static String regEx = "[/u4e00-/u9fa5]";static Pattern pat = Pattern.compile(regEx);public static void main(String[] args) {String input = "Astaga!";System.out.println(isContainsChinese(input));input = "halo dunia";System.out.println(isContainsChinese(input));} public static boolean isContainsChinese(String str){Matcher matcher = pat.matcher(str);boolean flg = false;if (matcher.find()) {flg = true;}kembalikan flg;}
Terakhir, kami melampirkan rentang pengkodean unicode untuk berbagai karakter:
* Karakter Cina: [0x4e00,0x9fa5] (atau desimal [19968,40869])
* Nomor: [0x30,0x39] (atau desimal [48, 57])
*Huruf kecil: [0x61,0x7a] (atau desimal [97, 122])
* Huruf besar: [0x41,0x5a] (atau desimal [65, 90])