Langsung saja ke kodenya:
Copy kode kodenya sebagai berikut:
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
*
* <p>
* Nama Kelas TampilkanChineseInUnicodeBlock
*</p>
* <p>
* Deskripsi memberikan gambaran untuk menentukan apakah suatu string adalah bahasa Mandarin atau Inggris.
*</p>
*
* @penulis wangxu [email protected]
* <p>
* Tanggal 16-09-2014 18:45:35
*</p>
* @versi V1.0
*
*/
kelas publik ShowChineseInUnicodeBlock {
public static void main(String[] args) {
String str = "Aku cinta kamu!?():;"",.";
char[] charArray = str.toCharArray();
for (int i = 0; i < charArray.length; i++) {
isCina(charArray[i]);
}
String chinese = "Astaga Cina";
System.out.println(isContainChinese(Cina));
String bahasa inggris = "dfafdabac";
System.out.println(isEnglish(english));
}
/**
*
* <p>
* Judul: adalah Cina
*</p>
* <p>
* Deskripsi: Fungsi ini digunakan untuk mencetak beberapa karakter untuk melihat miliknya
*</p>
*
* @param c
*
*/
public static void isChinese(char c) {
Karakter.UnicodeBlock ub = Karakter.UnicodeBlock.of(c);
if (ub == Karakter.UnicodeBlock.CJK_UNIFIED_IDEOGRAFS) {
Sistem.keluar.println(c + "--CJK_UNIFIED_IDEOGRAFS");
} else if (ub == Karakter.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAFS) {
System.out.println(c + "--CJK_COMPATIBILITY_IDEOGRAFS");
} else if (ub == Karakter.UnicodeBlock.CJK_UNIFIED_IDEOGRAFS_EXTENSION_A) {
// Ekstensi Ideograf Terpadu CJK WikipediaUnicode memperluas karakter Cina
// Ekstensi Ideograf Terpadu CJK A Ekstensi Ideograf Terpadu CJK A;
// Ekstensi Ideograf Terpadu CJK B. Ekstensi Ideograf Terpadu CJK B
Sistem.keluar.println(c + "--CJK_UNIFIED_IDEOGRAFS_EXTENSION_A");
} else if (ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) {//Tanda baca umum
System.out.println(c + "--GENERAL_PUNCTUATION");
} else if (ub == Karakter.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION) {
System.out.println(c + "--CJK_SYMBOLS_AND_PUNCTUATION");
} else if (ub == Karakter.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {
Sistem.keluar.println(c + "--HALFWIDTH_AND_FULLWIDTH_FORMS");
}
}
boolean statis publik isEnglish(String charaString) {
return charaString.cocok("^[a-zA-Z]*");
}
boolean statis publik isContainChinese(String str) {//Deteksi apakah berisi bahasa Mandarin
String regEx = "[//u4E00-//u9FA5]+";
Pola p = Pattern.compile(regEx);
Pencocokan m = p.pencocokan(str);
jika (m.temukan()) {
kembali benar;
} kalau tidak {
kembali salah;
}
}
}