특징:
******************************************
1. asp.net을 사용하여 개발하고 IIS에서 실행합니다.
2. 창고 설정에 따라 기존 홈페이지 시스템에 자동으로 연결될 수 있으며, 기존 시스템과 원활하게 통합되어 기존 시스템의 수집 프로그램을 보완 또는 대체할 수 있습니다.
3. 수집 스케줄링, 즉 예약 작업은 각 수집 규칙에 시간을 설정하여 예약된 시간에 반복적으로 수집할 수 있습니다. 설정된 시간에 도달하면 수집 프로그램이 자동으로 실행됩니다. 웹 서버의 백그라운드에서 실행되어 자동 업데이트의 필요성을 실제로 인식합니다.
4. 수집된 정보를 자동으로 분류할 수 있으며, 대상 분류가 존재하지 않는 경우 분류 매핑을 통해 대상 분류를 현재 웹사이트 콘텐츠 분류와 병합할 수도 있습니다. 카테고리별로 수집 작업을 생성할 필요가 없습니다.
5. 수집 규칙 설정은 간단하고 이해하기 쉽습니다. 이 프로그램에는 포그라운드 실행 또는 백그라운드 예약 실행의 두 가지 실행 모드가 있습니다.
6. 마스터-슬레이브 테이블 연관을 통해 컨텐츠 페이징, 다른 페이지의 부분 정보, 새로운 직렬화 및 기타 유형의 정보 수집과 같은 다단계 웹 페이지의 심층 수집을 실현할 수 있습니다.
7. 원본 중단점 이력서 수집, 수집 프로그램은 대상 웹사이트가 업데이트될 때만 수집하고 업데이트된 부분만 수집하므로 매우 효율적입니다. 이 기능은 연재 소설, TV 시리즈 등 연재 웹사이트를 수집하는 데 특히 유용합니다.
8. 사진, FLASH, 다운로드 파일 등 관련 외부 파일을 서버에 수동으로 업로드할 필요 없이 자동으로 로컬 서버에 다운로드하거나 원격 경로로 대체합니다.
9. 컬렉션 모델 정의를 지원합니다. 필요에 따라 수집할 데이터 항목을 정의할 수 있습니다. 각 모델에는 하위 모델도 포함될 수 있습니다.
10. 대부분의 수집 사이트의 웹 페이지 코드를 자동으로 식별합니다. 예를 들어 일반적인 GB2312, GBK, UTF-8, windows-1252, iso646-us 등이 있습니다.
11. 목록 페이지에서 썸네일 및 기타 추가 정보 수집을 지원합니다.
12. 다중 스레드 비동기 수집, 높은 수집 효율성 및 낮은 서버 리소스 소비.
v1.5.4
개선 : 2008-2-29 자동 재시작 시 수집 URL 대기열 번호가 5000을 초과하여 정지할 수 없는 문제 수정
개선 : 컬렉션 아이템의 고급 필터링 설정에서 교체가 가능합니다. 형식은 원래 필터링 규칙 뒤에 "[to]"를 추가하는 것입니다. 2008-2-29
추가됨: 수집소 서버에 더 큰 부담을 주지 않도록 수집 시간 간격 설정 추가 추가됨: 수집 웹사이트에 로그인 확인이 필요한 상황 추가, 로그인 및 확인 주소를 설정해야 함 2008-3-1
추가됨: JS 제출 방법(포스트) 페이지 매김을 나열합니다. 사용법: 제출 주소에 "?fc_action=post¶meter 1={$pageid}" 매개변수를 추가합니다. 제출 페이지에 이미 "?"가 포함되어 있으면 다음과 같습니다: "&fc_action=post¶meter 1={$pageid}" 2008-3 -1