使用正規表示式進行替換:
程式碼片段:
String documentTxt = EntityUtils.toString(entity,"gbk");//取得數據
documentTxt=documentTxt.replaceAll("[//t//n//r]", "");//將內容區域的回車換行移除
說明:String類別的replaceAll就有正規替換功能。 /t為製表符/n為換行/r為回車
java正規使用:
範例方法:
複製代碼代碼如下:
public void parseTxt(String content){
Pattern p = Pattern.compile(Config.articlePtn);
Matcher matcher = p.matcher(content);
while(matcher.find()){
System.out.println(matcher.group(1));
}
}
說明:只要記住Pattern類,它的靜態方法complie解析一個正規表示式產生一個Pattern物件。
然後用模型去匹配字串,得到一個Matcher,透過matcher的find方法遍歷所有的匹配。
group為正規表示式中的群組,及()表達式。 group(0)為原始字串,gourp(1)為符合的第一個群組...即符合到的群組的索引從1開始。