ดาวน์โหลด browsertrix - ดาวน์โหลด browsertrix ซอร์สโค้ด

browsertrix

ซอร์สโค้ดอื่น ๆ

ดาวน์โหลด

Browsertrix เป็นบริการรวบรวมข้อมูลบนเบราว์เซอร์ที่มีความเที่ยงตรงสูงบนระบบคลาวด์ ออกแบบมาเพื่อให้ทุกคนสามารถเก็บถาวรเว็บได้ง่ายขึ้นและเข้าถึงได้มากขึ้น

บริการนี้มี API และ UI สำหรับการกำหนดเวลาการรวบรวมข้อมูลและการดูผลลัพธ์ และการจัดการกระบวนการรวบรวมข้อมูลทุกด้าน ระบบนี้จัดเตรียมการจัดการและการจัดการเกี่ยวกับการรวบรวมข้อมูล ในขณะที่การรวบรวมข้อมูลจริงจะดำเนินการโดยใช้คอนเทนเนอร์ของ Browsertrix Crawler ซึ่งเปิดใช้งานสำหรับการรวบรวมข้อมูลแต่ละครั้ง

ดู webrecorder.net/browsertrix สำหรับภาพรวมคุณสมบัติและข้อมูลเกี่ยวกับวิธีการสมัครใช้บริการ Browsertrix ที่โฮสต์โดย Webrecorder

เอกสารประกอบ

เอกสารฉบับเต็มสำหรับการใช้ ปรับใช้ และการพัฒนา Browsertrix มีอยู่ที่ docs.browsertrix.com

เอกสารของเราสร้างขึ้นด้วย Material สำหรับ MKDocs

การปรับใช้

เอกสารการปรับใช้ล่าสุดมีอยู่ที่ docs.browsertrix.com/deploy

เอกสารครอบคลุมถึงการปรับใช้ Browsertrix ในสภาพแวดล้อมที่แตกต่างกันโดยใช้ Kubernetes ตั้งแต่การตั้งค่าโหนดเดียวไปจนถึงคลัสเตอร์ที่ปรับขนาดได้ในระบบคลาวด์

ในช่วงแรก Browsertrix ยังรองรับ Docker Compose และการปรับใช้แบบอิงพ็อดแมนด้วย สิ่งนี้เลิกใช้งานแล้วเนื่องจากความซับซ้อนในการรักษาความเท่าเทียมกันของฟีเจอร์ในการตั้งค่าต่างๆ และมีตัวเลือกการใช้งาน Kubernetes ที่หลากหลายและปรับใช้ได้ง่าย แม้ในเครื่องเดียว

การทำให้ Browsertrix ใช้งานได้ง่ายที่สุดเท่าที่จะเป็นไปได้ยังคงเป็นเป้าหมายสำคัญ และเรายินดีรับข้อเสนอแนะเกี่ยวกับวิธีที่เราสามารถปรับปรุงตัวเลือกการใช้งาน Kubernetes ของเราให้ดียิ่งขึ้น

หากคุณต้องการลองใช้การรวบรวมข้อมูลเพียงครั้งเดียว คุณอาจต้องการลองใช้ Browsertrix Crawler ก่อนเพื่อทดสอบความสามารถในการรวบรวมข้อมูล

มีส่วนร่วม

แม้ว่าระบบและ API แบ็กเอนด์จะค่อนข้างเสถียร แต่เรากำลังพัฒนาคุณสมบัติเพิ่มเติมมากมาย โปรดดูปัญหา GitHub และโครงการ GitHub นี้สำหรับแผนโครงการและงานปัจจุบันของเรา

คำแนะนำในการเริ่มต้นพัฒนาท้องถิ่นมีอยู่ที่ docs.browsertrix.com/develop