Код очень практичный, здесь нет ерунды, просто представьте его.
Основная функция — определить, содержит ли строка китайские символы, и заменить ее на ASCLL.
Private static String regEx = "[//u4e00-//u9fa5]"; /** * Определить, содержит ли строка китайские символы, и заменить их на ASCLL * * @param str_para * @return str_result */ Private static String isChinese_Replace( String str_para) { Шаблон p = Pattern.compile(regEx) String str_result = Str_para; Str_0 = ""; str_1 = ""; String str_data[] = null; String str_return_reslut = ""; if ( str_result != null && str_result.trim().length() > 0 ) { try { str_data = str_result.split( "" ); for ( int i = 0; i < str_data.length; i++ ) { Matcher m = p.matcher( str_data[i]); /* Ld(str_data[i]); */ int count = 0; if ( m.find() ) { count++; str_result = m.group(0); b = str_result. getBytes("GBK"); str_0 = Integer.toHexString(b[0]); ); str_return_reslut = str_return_reslut + "/" + conver10( str_0 ) + conver10( str_1 ) + "/" } else { str_return_reslut = str_return_reslut + str_data[i]; } } } catch ( NumberFormatException e ) { e.printStackTrace(); } catch (UnsupportedEncodingException e ) { e.printStackTrace(); } } else { return(str_return_reslut); } return(str_return_reslut } /* преобразование строки в десятичное число*/ public static int conver10( String str_0 ) { return(Integer.parseInt( str_0.substring); (str_0.length() - 2, str_0.length()), 16) }
Давайте взглянем на немного более простой код, который можно использовать в местах, где спрос не высок.
импорт java.util.regex.Matcher;импорт java.util.regex.Pattern;публичная демонстрация класса {static String regEx = "[/u4e00-/u9fa5]";static Pattern pat = Pattern.compile(regEx);public static void main(String[] args) {String input = "Адский мир!";System.out.println(isContainsChinese(input));input = "hello world";System.out.println(isContainsChinese(input));} public static boolean isContainsChinese(String str){Matcher matcher = pat.matcher(str);boolean flg = false;if (matcher.find()) {flg = true;} return flg;}
Наконец, мы прикрепляем диапазон кодировок Юникода для различных символов:
* Китайские иероглифы: [0x4e00,0x9fa5] (или десятичные [19968,40869]).
* Число: [0x30,0x39] (или десятичное [48, 57])
*Строчные буквы: [0x61,0x7a] (или десятичные [97, 122]).
* Прописные буквы: [0x41,0x5a] (или десятичные [65, 90])