Vaya directamente al código:
Copie el código de código de la siguiente manera:
importar java.util.regex.Matcher;
importar java.util.regex.Pattern;
/**
*
*<p>
* Nombre de clase ShowChineseInUnicodeBlock
*</p>
*<p>
* La descripción proporciona una idea para determinar si una cadena es china o inglesa.
*</p>
*
* @autor wangxu [email protected]
*<p>
* Fecha 2014-9-16 18:45:35
*</p>
* @versión V1.0
*
*/
clase pública ShowChineseInUnicodeBlock {
público estático vacío principal (String [] argumentos) {
String str = "¿¡Te amo!? ():;"",.";
char[] charArray = str.toCharArray();
para (int i = 0; i < charArray.length; i++) {
es chino(charArray[i]);
}
String chino = "Maldita sea china";
System.out.println(isContainChinese(chino));
Cadena inglés = "dfafdabac";
System.out.println(isEnglish(inglés));
}
/**
*
*<p>
* Título: es chino
*</p>
*<p>
* Descripción: Esta función se utiliza para imprimir algunos caracteres para ver a qué pertenecen
*</p>
*
* @param c
*
*/
El vacío estático público es chino (char c) {
Carácter.UnicodeBlock ub = Carácter.UnicodeBlock.of(c);
if (ub == Carácter.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS) {
System.out.println(c + "--CJK_UNIFIED_IDEOGRAPHS");
} más si (ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS) {
System.out.println(c + "--CJK_COMPATIBILITY_IDEOGRAPHS");
} más si (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A) {
// Extensión de ideogramas unificados CJK WikipediaUnicode extiende los caracteres chinos
// Extensión A de ideogramas unificados de CJK Extensión A de ideogramas unificados de CJK;
// Extensión B de Ideogramas unificados CJK Extensión B de Ideogramas unificados CJK
System.out.println(c + "--CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A");
} else if (ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) {//Puntuación general
System.out.println(c + "--GENERAL_PUNCTUATION");
} más si (ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION) {
System.out.println(c + "--CJK_SYMBOLS_AND_PUNCTUATION");
} más si (ub == Carácter.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {
System.out.println(c + "--HALFWIDTH_AND_FULLWIDTH_FORMS");
}
}
público estático booleano es inglés (String charaString) {
return charaString.matches("^[a-zA-Z]*");
}
public static boolean isContainChinese(String str) {// Detecta si contiene chino
Cadena expresión regular = "[//u4E00-//u9FA5]+";
Patrón p = Patrón.compile(regEx);
Emparejador m = p.matcher(str);
si (m.buscar()) {
devolver verdadero;
} demás {
devolver falso;
}
}
}