El código es muy práctico, no hay tonterías aquí, solo preséntalo.
La función principal es determinar si una cadena contiene caracteres chinos y reemplazarla con ASCLL.
private static String regEx = "[//u4e00-//u9fa5]"; /** * Determinar si la cadena contiene caracteres chinos y reemplazarlos con ASCLL * * @param str_para * @return str_result */ private static String isChinese_Replace( String str_para ) { Patrón p = Pattern.compile( regEx ); Cadena str_result = str_para; Cadena str_0 = ""; str_1 = ""; String str_data[] = null; String str_return_reslut = ""; if ( str_result != null && str_result.trim().length() > 0 ) { intentar { str_data = str_result.split( "" ); for (int i = 0; i < str_data.length; i++) { Matcher m = p.matcher( str_data[i]); /* Ld(str_data[i]); */ int recuento = 0; if ( m.find() ) { str_result = m.group( 0 ); getBytes( "GBK" ); str_0 = Integer.toHexString( b[0] ); ); str_return_reslut = str_return_reslut + "/" + conver10( str_0 ) + conver10( str_1 ) + "/"; } else { str_return_reslut = str_return_reslut + str_data[i] } } } catch ( NumberFormatException e ) { e.printStackTrace(); ; } captura (UnsupportedEncodingException e ) { e.printStackTrace(); } } else { return(str_return_reslut); } return(str_return_reslut } /* Conversión de cadena a decimal*/ public static int conver10( String str_0 ) { return(Integer.parseInt( str_0.substring ( str_0.length() - 2, str_0.length() ), 16 ) }
Echemos un vistazo a un código un poco más simple que se puede usar en lugares donde la demanda no es alta.
importar java.util.regex.Matcher; importar java.util.regex.Pattern; demostración de clase pública {static String regEx = "[/u4e00-/u9fa5]"; patrón estático pat = Pattern.compile(regEx); public static void main(String[] args) {String input = "¡Mundo infernal!";System.out.println(isContainsChinese(input));entrada = "hola mundo";System.out.println(isContainsChinese(input));} public static boolean isContainsChinese(String str){Matcher matcher = pat.matcher(str);boolean flg = false;if (matcher.find()) {flg = verdadero;}devolver flg;}
Finalmente, adjuntamos la gama de codificaciones Unicode para varios caracteres:
* Caracteres chinos: [0x4e00,0x9fa5] (o decimal [19968,40869])
* Número: [0x30,0x39] (o decimal [48, 57])
*Letras minúsculas: [0x61,0x7a] (o decimal [97, 122])
* Letras mayúsculas: [0x41,0x5a] (o decimal [65, 90])