DrissionPage는 드라이버와 세션으로 구성된 페이지입니다. Python 기반의 웹 자동화 운영 통합 도구입니다.
POM 모드를 사용하여 페이지와 요소의 일반적인 방법을 캡슐화하고 브라우저 자동화의 편리성과 높은 효율성을 고려하여 브라우저와 요청 간의 원활한 전환을 실현하는 간단하고 직관적이며 우아한 요소 위치 지정 구문 세트가 함께 제공됩니다. 효율성, 그리고 더 나은 점은 사용법이 매우 간결하고 사용자 친화적이며 코드가 적고 초보자에게 친숙하다는 것입니다.
데이터 수집 요청을 사용할 때 로그인하려는 웹사이트에 접속할 때 데이터 패킷과 JS 소스 코드를 분석하고 복잡한 요청을 구성해야 하며 인증 코드, JS 난독화와 같은 크롤링 방지 방법을 처리해야 하는 경우가 많습니다. 및 서명 매개변수가 높습니다. JS 계산으로 데이터를 생성하는 경우 계산 프로세스를 재현해야 하므로 경험이 부족하고 개발 효율성이 낮습니다.
브라우저를 사용하면 이러한 함정을 대부분 우회할 수 있지만 브라우저는 그리 효율적이지 않습니다. 따라서 이 라이브러리는 이를 하나로 통합하고, 필요에 따라 해당 모드를 전환하며, 인간화된 사용 방법을 제공하여 개발 및 운영 효율성을 향상시킵니다.
이 라이브러리는 두 가지를 병합하는 것 외에도 일반적으로 사용되는 기능을 웹 페이지 단위로 캡슐화하고 매우 간단한 작업 및 명령문을 제공합니다. 자동화된 웹 페이지 작업에 사용하면 세부 사항을 고려하고 기능 구현에 집중할 필요성을 줄여줍니다. 사용하기 편리합니다.
모든 것을 단순하게 유지하고, 간단하고 직접적인 사용 방법을 제공하고, 초보자에게 더욱 친절하게 대하십시오.
저자는 수많은 함정을 밟고 그 모든 경험을 이 도서관에 정리했다. 많은 실용적인 기능을 내장하고 있으며, 일반적으로 사용되는 기능을 통합하고 최적화했습니다.
특성
1. 코드는 고도로 통합되어 있으며 간결한 코드를 최우선으로 생각합니다.
2. 페이지 개체는 브라우저와 요청 사이를 마음대로 전환할 수 있으며 로그인 상태는 유지됩니다.
3. 매우 간단하지만 강력한 요소 위치 지정 구문은 체인 작업을 지원하며 코드는 매우 간결합니다.
4. 두 가지 모드는 일관된 API와 일관된 사용 경험을 제공합니다.
5. 인간화 디자인, 많은 실용적인 기능을 통합하여 개발 작업량을 크게 줄입니다.
1. 프로그램을 실행할 때마다 열려 있는 브라우저를 다시 사용할 수 있습니다. 예를 들어 웹 페이지를 특정 상태로 수동으로 설정한 다음 프로그램을 사용하여 인계 받거나 로그인을 수동으로 처리한 다음 프로그램을 사용하여 콘텐츠를 크롤링합니다. 매번 처음부터 브라우저를 시작할 필요가 없으므로 매우 편리합니다.
2. ini 파일을 이용하여 자주 사용하는 구성을 저장하고 자동으로 호출할 수 있으며, 복잡한 구성 항목에서 벗어나 편리한 설정 API도 제공합니다.
3. 매우 간결한 위치 지정 구문은 텍스트로 직접 요소 위치 지정을 지원하고 전후의 형제 요소와 상위 요소를 직접 가져옵니다.
4. 강력한 다운로드 도구를 사용하면 브라우저를 작동할 때 빠르고 안정적인 다운로드 기능을 즐길 수 있습니다.
5. 다운로드 도구는 파일 이름 충돌을 처리하고, 대상 경로를 자동으로 생성하고, 연결을 끊고 다시 시도하는 등 다양한 방법을 지원합니다.
6. 접속 URL은 자동 재시도 기능을 가지고 있으며, 간격 및 타임아웃 시간을 설정할 수 있습니다.
7. 웹 페이지 접속 시 수동 설정 없이 자동으로 인코딩을 인식할 수 있습니다.
8. 링크 매개변수는 기본적으로 호스트 및 리퍼러 속성을 자동으로 생성합니다.
9. 헤드리스나 최소화 없이 언제든지 브라우저 프로세스 창을 직접 숨기거나 표시할 수 있습니다.
10. 적절한 크롬 드라이버를 자동으로 다운로드하여 번거로운 구성을 제거합니다.
11. d 모드의 검색 요소에는 대기 기능이 내장되어 있으며 전역 대기 시간 또는 단일 검색 대기 시간을 임의로 설정할 수 있습니다.
12. click 요소에는 js 클릭 방식이 통합되어 있으며 하나의 매개변수로 클릭 방식을 전환할 수 있습니다.
13. 클릭은 성공적인 클릭을 보장하고 웹 페이지 마스크 레이어가 사라지는지 여부를 결정하는 데 사용할 수 있는 실패한 재시도를 지원합니다.
14. 텍스트 입력은 성공 여부를 자동으로 결정하고 특정 상황에서 잘못된 입력이나 삭제를 방지하기 위해 재시도할 수 있습니다.
15. d 모드는 요소의 속성을 직접 얻을 수 있는 모든 기능을 갖춘 xpath를 지원합니다. Selenium에는 기본적으로 이 기능이 없습니다.
16. Shadow-Root 직접 획득을 지원하며, 그 하위 요소를 일반 요소처럼 동작시킵니다.
17. 의사 요소 이전 및 이후의 콘텐츠에 대한 직접 액세스를 지원합니다.
18. 요소 바로 아래에 >를 사용하면 CSS 선택기를 사용하여 현재 요소의 직접 하위 요소를 가져올 수 있습니다. 이 쓰기 방법은 기본적으로 지원되지 않습니다.
19. lxml을 사용하여 d-모드 페이지나 요소를 간단히 구문 분석할 수 있으며, 복잡한 페이지 데이터를 크롤링하는 속도가 크게 향상됩니다.
20. 작업의 중복을 줄이기 위해 출력 데이터를 기본 조판용으로 트랜스코딩 및 처리했습니다.
21. 셀레늄과 쉽게 연결하거나 네이티브 코드를 요청하여 프로젝트 마이그레이션을 용이하게 할 수 있습니다.
22. POM 모드 패키징을 사용하면 테스트에 직접 사용할 수 있으며 확장이 쉽습니다.
23. d 모드 구성은 debugger_address 및 기타 매개변수와 동시에 호환되지만 기본 구성은 호환되지 않습니다.
24. 여기에 나열되지 않은 것들도 더 많이 있습니다...