Verwenden Sie reguläre Ausdrücke zum Ersetzen von:
Codeausschnitt:
String documentTxt = EntityUtils.toString(entity,"gbk");//Daten abrufen
documentTxt=documentTxt.replaceAll("[//t//n//r]", "");//Wagenrückläufe und Zeilenvorschübe im Inhaltsbereich entfernen
Hinweis: „replaceAll“ der String-Klasse verfügt über eine reguläre Ersetzungsfunktion. /t ist Tabulator/n ist Zeilenvorschub/r ist Wagenrücklauf
Regelmäßige Java-Nutzung:
Beispielmethode:
Kopieren Sie den Codecode wie folgt:
public void parseTxt(String content){
Muster p = Pattern.compile(Config.articlePtn);
Matcher matcher = p.matcher(content);
while(matcher.find()){
System.out.println(matcher.group(1));
}
}
Hinweis: Denken Sie nur an die Pattern-Klasse. Ihre statische Kompilierungsmethode analysiert einen regulären Ausdruck, um ein Pattern-Objekt zu generieren.
Verwenden Sie dann das Modell, um die Zeichenfolge abzugleichen, einen Matcher zu erhalten und alle Übereinstimmungen über die Suchmethode des Matchers zu durchlaufen.
Gruppe ist die Gruppe im regulären Ausdruck und () Ausdruck. Gruppe (0) ist die ursprüngliche Zeichenfolge, gourp (1) ist die erste übereinstimmende Gruppe ... das heißt, der Index der übereinstimmenden Gruppe beginnt bei 1.