DrissionPage เป็นเพจที่ประกอบด้วยไดรเวอร์และเซสชัน เป็นเครื่องมือบูรณาการการดำเนินการเว็บอัตโนมัติที่ใช้ Python
ใช้โหมด POM เพื่อสรุปวิธีการทั่วไปของหน้าและองค์ประกอบ และมาพร้อมกับชุดไวยากรณ์การวางตำแหน่งองค์ประกอบที่เรียบง่าย ใช้งานง่าย และสวยงาม ซึ่งช่วยให้สามารถสลับระหว่างเบราว์เซอร์และคำขอได้อย่างราบรื่น โดยคำนึงถึงความสะดวกของระบบอัตโนมัติของเบราว์เซอร์และประสิทธิภาพสูงของ คำขอมีประสิทธิภาพและดียิ่งกว่านั้นคือการใช้งานมีความกระชับและใช้งานง่ายโดยใช้โค้ดน้อยลงและเป็นมิตรกับมือใหม่
เมื่อใช้คำขอรวบรวมข้อมูล เมื่อพบกับเว็บไซต์ที่คุณต้องการเข้าสู่ระบบ คุณต้องวิเคราะห์แพ็กเก็ตข้อมูลและซอร์สโค้ด JS สร้างคำขอที่ซับซ้อน และมักจะต้องจัดการกับวิธีการป้องกันการรวบรวมข้อมูล เช่น รหัสยืนยัน JS obfuscation และพารามิเตอร์ลายเซ็นมีค่าสูง หากข้อมูลถูกสร้างขึ้นโดยการคำนวณ JS จะต้องทำซ้ำขั้นตอนการคำนวณ ซึ่งส่งผลให้ได้รับประสบการณ์ที่ไม่ดีและประสิทธิภาพในการพัฒนาต่ำ
การใช้เบราว์เซอร์สามารถหลีกเลี่ยงข้อผิดพลาดเหล่านี้ได้เป็นส่วนใหญ่ แต่เบราว์เซอร์ไม่ได้มีประสิทธิภาพมากนัก ดังนั้นไลบรารีนี้จะรวมไลบรารีเหล่านั้นเป็นหนึ่งเดียว สลับโหมดที่เกี่ยวข้องเมื่อจำเป็น และจัดเตรียมวิธีการใช้งานแบบมนุษย์เพื่อปรับปรุงการพัฒนาและประสิทธิภาพการดำเนินงาน
นอกเหนือจากการรวมทั้งสองเข้าด้วยกันแล้ว ไลบรารีนี้ยังรวมฟังก์ชันที่ใช้กันทั่วไปในหน่วยหน้าเว็บและให้การดำเนินการและคำสั่งที่ง่ายมาก เมื่อใช้สำหรับการดำเนินการหน้าเว็บอัตโนมัติ จะช่วยลดความจำเป็นในการพิจารณารายละเอียดและมุ่งเน้นไปที่การใช้งานฟังก์ชัน ทำให้มีมากขึ้น สะดวกในการใช้งาน
ทำให้ทุกอย่างเรียบง่าย พยายามจัดเตรียมวิธีการใช้งานที่เรียบง่ายและตรงไปตรงมา และเป็นมิตรกับมือใหม่มากขึ้น
ผู้เขียนได้ก้าวข้ามข้อผิดพลาดนับไม่ถ้วนและสรุปประสบการณ์ทั้งหมดในห้องสมุดแห่งนี้ มีฟังก์ชันการใช้งานจริงมากมายในตัว และฟังก์ชันที่ใช้กันทั่วไปได้รับการผสานรวมและปรับให้เหมาะสมที่สุด
ลักษณะเฉพาะ
1. รหัสมีการบูรณาการอย่างมาก โดยมีรหัสที่กระชับเป็นการติดตามครั้งแรก
2. สามารถสลับวัตถุหน้าระหว่างเบราว์เซอร์และคำขอได้ตามต้องการ และสถานะการเข้าสู่ระบบจะยังคงอยู่
3. ไวยากรณ์การวางตำแหน่งองค์ประกอบที่เรียบง่ายแต่ทรงพลัง รองรับการทำงานของลูกโซ่ และโค้ดมีความกระชับอย่างยิ่ง
4. ทั้งสองโหมดมี API ที่สอดคล้องกันและประสบการณ์การใช้งานที่สอดคล้องกัน
5. การออกแบบโดยมนุษย์ บูรณาการฟังก์ชันการปฏิบัติหลายอย่าง ช่วยลดภาระงานในการพัฒนาได้อย่างมาก
1. คุณสามารถใช้เบราว์เซอร์ที่เปิดอยู่ซ้ำได้ทุกครั้งที่คุณเรียกใช้โปรแกรม ตัวอย่างเช่น ตั้งค่าหน้าเว็บเป็นสถานะใดสถานะหนึ่งด้วยตนเอง จากนั้นใช้โปรแกรมเพื่อเข้าควบคุม หรือจัดการการเข้าสู่ระบบด้วยตนเอง จากนั้นใช้โปรแกรมเพื่อรวบรวมข้อมูลเนื้อหา ไม่จำเป็นต้องเปิดเบราว์เซอร์ตั้งแต่ต้นทุกครั้ง ซึ่งสะดวกมาก
2. ใช้ไฟล์ ini เพื่อบันทึกการกำหนดค่าที่ใช้ทั่วไปและเรียกใช้โดยอัตโนมัติ นอกจากนี้ยังมี API การตั้งค่าที่สะดวกเพื่อหลีกเลี่ยงรายการการกำหนดค่าที่ซับซ้อน
3. ไวยากรณ์การวางตำแหน่งที่กระชับอย่างยิ่งสนับสนุนองค์ประกอบการวางตำแหน่งโดยตรงจากข้อความและรับองค์ประกอบพี่น้องและองค์ประกอบหลักโดยตรงก่อนและหลัง
4. เครื่องมือดาวน์โหลดอันทรงพลัง คุณสามารถเพลิดเพลินกับฟังก์ชั่นการดาวน์โหลดที่รวดเร็วและเชื่อถือได้เมื่อใช้งานเบราว์เซอร์
5. เครื่องมือดาวน์โหลดรองรับหลายวิธีในการจัดการข้อขัดแย้งของชื่อไฟล์ สร้างเส้นทางเป้าหมายโดยอัตโนมัติ ยกเลิกการเชื่อมต่อและลองใหม่อีกครั้ง ฯลฯ
6. URL การเข้าถึงมีฟังก์ชันลองใหม่อัตโนมัติ และสามารถตั้งค่าช่วงเวลาและเวลาหมดเวลาได้
7. เมื่อเข้าถึงหน้าเว็บ การเข้ารหัสสามารถรับรู้ได้โดยอัตโนมัติโดยไม่ต้องตั้งค่าด้วยตนเอง
8. พารามิเตอร์ลิงก์จะสร้างแอตทริบิวต์โฮสต์และผู้อ้างอิงโดยอัตโนมัติตามค่าเริ่มต้น
9. คุณสามารถซ่อนหรือแสดงหน้าต่างกระบวนการของเบราว์เซอร์ได้โดยตรงเมื่อใดก็ได้ โดยไม่ต้องย่อหรือย่อขนาด
10. สามารถดาวน์โหลด Chromedriver ที่เหมาะสมได้โดยอัตโนมัติ ช่วยลดการกำหนดค่าที่ยุ่งยาก
11. องค์ประกอบการค้นหาในโหมด d มีการรอคอยในตัว และสามารถตั้งค่าเวลารอทั่วโลกหรือเวลารอการค้นหาเดี่ยวได้ตามต้องการ
12. องค์ประกอบคลิกรวมวิธีการคลิก js และวิธีการคลิกสามารถเปลี่ยนได้ด้วยพารามิเตอร์เดียว
13. การสนับสนุนการคลิกล้มเหลวในการลองใหม่ ซึ่งสามารถใช้เพื่อรับประกันการคลิกสำเร็จ ตรวจสอบว่าเลเยอร์มาสก์ของหน้าเว็บหายไปหรือไม่ เป็นต้น
14. การป้อนข้อความสามารถระบุได้โดยอัตโนมัติว่าสำเร็จหรือไม่ และลองอีกครั้งเพื่อหลีกเลี่ยงการป้อนหรือการล้างที่ไม่ถูกต้องในบางสถานการณ์
15. โหมด d รองรับ xpath ที่มีคุณสมบัติครบถ้วน ซึ่งสามารถรับแอตทริบิวต์ขององค์ประกอบได้โดยตรง
16. รองรับการรับ shadow-root โดยตรง และดำเนินการองค์ประกอบด้านล่างเหมือนองค์ประกอบทั่วไป
17. รองรับการเข้าถึงโดยตรงไปยังเนื้อหาของหลังและก่อนองค์ประกอบหลอก
18. คุณสามารถใช้ > โดยตรงภายใต้องค์ประกอบเพื่อรับองค์ประกอบลูกโดยตรงขององค์ประกอบปัจจุบันโดยใช้ตัวเลือก css วิธีการเขียนนี้ไม่ได้รับการสนับสนุนโดยกำเนิด
19. คุณสามารถใช้ lxml เพื่อแยกวิเคราะห์เพจหรือองค์ประกอบ d-mode และความเร็วของการรวบรวมข้อมูลเพจที่ซับซ้อนได้รับการปรับปรุงอย่างมาก
20. ข้อมูลเอาต์พุตได้รับการแปลงรหัสและประมวลผลสำหรับการเรียงพิมพ์พื้นฐานเพื่อลดความซ้ำซ้อนของงาน
21. สามารถเชื่อมต่อกับซีลีเนียมได้อย่างง่ายดายหรือขอโค้ดเนทีฟเพื่ออำนวยความสะดวกในการโยกย้ายโครงการ
22. การใช้บรรจุภัณฑ์โหมด POM สามารถใช้ทดสอบได้โดยตรงและขยายได้ง่าย
23. การกำหนดค่าโหมด d เข้ากันได้กับ debugger_address และพารามิเตอร์อื่นๆ ในเวลาเดียวกัน แต่การกำหนดค่าดั้งเดิมเข้ากันไม่ได้
24. ยังมีอีกมากมายที่ไม่ได้ระบุไว้ที่นี่...