正規表現を使用して以下を置き換えます。
コードスニペット:
String documentTxt = EntityUtils.toString(entity,"gbk");//データを取得
documentTxt=documentTxt.replaceAll("[//t//n//r]", "");//コンテンツ領域のキャリッジリターンとラインフィードを削除します
注: String クラスの replaceAll には定期的な置換関数があります。 /tはタブ/nはラインフィード/rはキャリッジリターン
Javaの通常の使用:
方法の例:
次のようにコードをコピーします。
public void parseTxt(String content){
パターン p = Pattern.compile(Config.articlePtn);
マッチャー matcher = p.matcher(content);
while(matcher.find()){
System.out.println(matcher.group(1));
}
}
注: Pattern クラスを覚えておいてください。その静的メソッドは、正規表現をコンパイルして解析し、Pattern オブジェクトを生成します。
次に、モデルを使用して文字列を照合し、Matcher を取得し、Matcher の find メソッドを通じてすべての一致を調べます。
group は正規表現内のグループであり、() 式です。 group(0) は元の文字列、gourp(1) は最初に一致したグループです。つまり、一致したグループのインデックスは 1 から始まります。