정규식을 사용하여 다음을 바꾸십시오.
코드 조각:
String documentTxt = EntityUtils.toString(entity,"gbk");//데이터 가져오기
documentTxt=documentTxt.replaceAll("[//t//n//r]", "");//콘텐츠 영역에서 캐리지 리턴 및 줄 바꿈 제거
참고: String 클래스의 replacementAll에는 일반 교체 기능이 있습니다. /t는 탭이고, n은 줄바꿈이고, r은 캐리지 리턴입니다.
Java 일반 사용:
예시 방법:
다음과 같이 코드 코드를 복사합니다 .
공개 무효 구문 분석Txt(문자열 내용){
패턴 p = Pattern.compile(Config.articlePtn);
일치자 matcher = p.matcher(content);
동안(matcher.find()){
System.out.println(matcher.group(1));
}
}
참고: Pattern 클래스를 기억하세요. 이 클래스의 정적 메서드 컴파일은 정규식을 구문 분석하여 Pattern 개체를 생성합니다.
그런 다음 모델을 사용하여 문자열을 일치시키고 Matcher를 얻은 다음 matcher의 find 메서드를 통해 모든 일치 항목을 탐색합니다.
group은 정규식의 그룹이고 () 표현식입니다. group(0)은 원래 문자열이고, gourp(1)은 첫 번째로 일치하는 그룹입니다. 즉, 일치하는 그룹의 인덱스는 1부터 시작합니다.