นี่คือยูทิลิตี้ Python3 สำหรับการเก็บถาวรเรื่องราวแบบโต้ตอบจาก Writing.com
การเก็บถาวรเรื่องราวจะดาวน์โหลดทุกบทจากเรื่องนั้นเป็น ./archive/<story_id>/
/ เป็นชุดไฟล์ HTML ที่สามารถเรียกดูได้ซึ่งคุณสามารถเปิดได้ในเบราว์เซอร์ของคุณ อัปเดตเรื่องราวดาวน์โหลดบทใหม่ใด ๆ ลงในคลังเก็บ
การใช้บรรทัดคำสั่ง:
$ cd <path-to-source>
$ pip install -r requirements.txt # Install dependencies
$ chmod +x run.py # If the following commands do not work
$ ./run.py get <id1> <id2>... # Downloads or updates interactives with item_ids <id1>, <id2>...
$ ./run.py get_search "<url1>" "<url2>"... # Downloads every interactive in these search results. See note below.
$ ./run.py update # Update existing archives
item_id สำหรับเรื่องราวอยู่ใน URL ของมัน: http://www.writing.com/main/interact/item_id/$(THIS_IS_THE_ITEM_ID)/map/14411122
หากต้องการรับ URL ที่เหมาะสมก่อนอื่นให้ป้อนคำค้นหาของคุณลงในกล่องข้อความที่ด้านบนซ้ายของหน้าแล้วกด Enter (หรือคลิกแว่นขยาย) คุณจะถูกนำไปที่หน้าผลการค้นหา ในหน้านี้คุณจะเห็นคำค้นหาของคุณที่ศูนย์ด้านบน ทางด้านขวาของสิ่งนั้นคือแบบเลื่อนลงที่โดยค่าเริ่มต้นบอกว่า "สิ่งที่ต้องอ่าน" ในแบบเลื่อนลงนั้นเลือก "การโต้ตอบ" จากนั้นคลิกปุ่ม "ไป" ด้านล่าง ผลลัพธ์ทั้งหมดควรเป็นแบบโต้ตอบเท่านั้น สุดท้ายคลิกที่ไอคอนแว่นขยายเหนือผลลัพธ์เพื่อทำซ้ำการค้นหา ตอนนี้ URL ของคุณอยู่ในรูปแบบที่ถูกต้องสำหรับ get_search อย่าลืมพูดด้วย ""
แก้ไข config.yaml ก่อนด้วยชื่อผู้ใช้และรหัสผ่านของคุณสำหรับการเข้าสู่ระบบ
ต้องใช้ Python3 และแพ็คเกจใน requirements.txt
. txt
คุณอาจพบข้อผิดพลาดในขณะที่พยายามดาวน์โหลดเรื่องราว หากข้อผิดพลาดไม่ขัดข้องยูทิลิตี้ฉันขอแนะนำให้พยายามดาวน์โหลดอีกครั้งเนื่องจากข้อผิดพลาดบางอย่างเป็นชั่วคราว แต่แจ้งให้เราทราบว่าเรื่อง/บทที่คุณมีปัญหาอะไรและฉันจะดูว่าฉันทำอะไรได้บ้าง
หากข้อผิดพลาดขัดข้องยูทิลิตี้ฉันขอแนะนำให้เข้าสู่ระบบอีกครั้ง สถานการณ์กรณีที่ดีที่สุดไม่ว่าจะเป็นการเข้าสู่ระบบของคุณนั้นไม่ได้รับการรับรองหรือการเขียน. com ได้ตัดสินใจที่จะหยุดการรับใช้เซสชันของคุณ ลบ session
(ไม่ใช่ session.py
!) แล้วคุณจะถูกขอข้อมูลรับรองของคุณอีกครั้ง โปรดทราบว่าจะไม่บอกคุณว่าการเข้าสู่ระบบสำเร็จหรือไม่ หากยังล้มเหลวโปรดแจ้งให้เราทราบ
ยูทิลิตี้นี้ยังสามารถทำงานในคอนเทนเนอร์ คอนเทนเนอร์จัดการการติดตั้งการพึ่งพาที่ต้องการทั้งหมดสำหรับการเรียกใช้ยูทิลิตี้
$ cd < path-to-source >
$ docker-compose build
$ docker-compose run writing.com-archival
# After running the above commands, the command line arguments stay the same.
root@writing-com-archival:/code# ./run.py get < id 1> < id 2> ... # Downloads or updates interactives with item_ids <id1>, <id2>...
root@writing-com-archival:/code# ./run.py get_search " <url1> " " <url2> " ... # Downloads every interactive in these search results. See note below.
root@writing-com-archival:/code# ./run.py update # Update existing archives
docker-compose build
คำสั่งนี้จะใช้ไฟล์ docker-compose.yml เพื่อสร้างคอนเทนเนอร์ที่กำหนดไว้ใน DockerFile docker-compose run writing.com-archival
คำสั่งนี้จะใช้ไฟล์ Docker-compose.yml เพื่อเรียกใช้คอนเทนเนอร์ Writing.com-Archival แบบโต้ตอบในเซสชันเชลล์ปัจจุบัน อย่าใช้ Git สำหรับ Bash เพื่อเรียกใช้คำสั่งนี้