コードに直接移動します。
次のようにコードをコピーします。
java.util.regex.Matcherをインポートします。
java.util.regex.Patternをインポートします。
/**
*
*<p>
* クラス名 Show ChineseInUnicodeBlock
*</p>
*<p>
* 説明は、文字列が中国語か英語かを判断するためのアイデアを提供します。
*</p>
*
* @著者王徐 [email protected]
* <p>
* 日付 2014-9-16 06:45:35 PM
*</p>
* @バージョンV1.0
*
*/
パブリック クラス Show ChineseInUnicodeBlock {
public static void main(String[] args) {
String str = "愛してる!? ():;"",.";
char[] charArray = str.toCharArray();
for (int i = 0; i < charArray.length; i++) {
is中国語(charArray[i]);
}
文字列 chinese = "中国人なんてクソ";
System.out.println(isContain Chinese(中国語));
文字列英語 = "dfafdabac";
System.out.println(isEnglish(英語));
}
/**
*
*<p>
* タイトル: is中国語
*</p>
* <p>
* 説明: この関数は、いくつかの文字を出力して、それらが何に属しているかを確認するために使用されます。
*</p>
*
* @param c
*
*/
public static void is Chinese(char c) {
Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS) {
System.out.println(c + "--CJK_UNIFIED_IDEOGRAPHS");
} else if (ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS) {
System.out.println(c + "--CJK_COMPATIBILITY_IDEOGRAPHS");
} else if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A) {
// CJK Unified Ideographs Extension WikipediaUnicode は漢字を拡張します
// CJK 統一表意文字拡張 A CJK 統一表意文字拡張 A;
// CJK 統一表意文字拡張 B CJK 統一表意文字拡張 B
System.out.println(c + "--CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A");
} else if (ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) {//一般的な句読点
System.out.println(c + "--GENERAL_PUNCTUATION");
else if (ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION) {
System.out.println(c + "--CJK_SYMBOLS_AND_PUNCTUATION");
else if (ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {
System.out.println(c + "--HALFWIDTH_AND_FULLWIDTH_FORMS");
}
}
public static boolean isEnglish(String charString) {
return characterString.matches("^[a-zA-Z]*");
}
public static boolean isContain Chinese(String str) {//中国語が含まれているかどうかを検出します
文字列正規表現 = "[//u4E00-//u9FA5]+";
パターン p = Pattern.compile(regEx);
マッチャー m = p.matcher(str);
if (m.find()) {
true を返します。
} それ以外 {
false を返します。
}
}
}