simplified search engine 다운로드 - simplified search engine 소스 코드 다운로드

다운로드

단순화된 검색 엔진

이 프로그램은 Python 언어로 작성되었으며 정규 표현식을 사용하여 HTML을 구문 분석하고 멀티스레딩을 사용하여 더 빠르게 진행합니다. 데이터베이스 부분은 MongoDB에 의해 보장됩니다. 프로젝트에는 4개의 파일이 포함되어 있습니다.

- HTML 콘텐츠를 가져오고, 구문 분석하고, 저장하고, 페이지 콘텐츠의 각 링크에 대해 새 PersonalParser 스레드를 시작하는 PersonnalParser 클래스가 포함되어 있습니다.

- DB와의 연결과 삽입 및/또는 찾기 작업을 보장하는 DBManager 클래스가 포함되어 있습니다.

- 시작 URL, 프록시 설정 및 깊이 검색과 같은 일반 설정이 포함되어 있습니다. 첫 번째 크롤링 스레드가 여기에서 시작됩니다.

- 사용자 검색을 가져오고, 데이터베이스 콘텐츠를 가져오고, 결과를 관련성에 따라 정렬하는 코드가 포함되어 있습니다.

확장하다

추가 정보