Browsertrix เป็นบริการรวบรวมข้อมูลบนเบราว์เซอร์ที่มีความเที่ยงตรงสูงบนระบบคลาวด์ ออกแบบมาเพื่อให้ทุกคนสามารถเก็บถาวรเว็บได้ง่ายขึ้นและเข้าถึงได้มากขึ้น
บริการนี้มี API และ UI สำหรับการกำหนดเวลาการรวบรวมข้อมูลและการดูผลลัพธ์ และการจัดการกระบวนการรวบรวมข้อมูลทุกด้าน ระบบนี้จัดเตรียมการจัดการและการจัดการเกี่ยวกับการรวบรวมข้อมูล ในขณะที่การรวบรวมข้อมูลจริงจะดำเนินการโดยใช้คอนเทนเนอร์ของ Browsertrix Crawler ซึ่งเปิดใช้งานสำหรับการรวบรวมข้อมูลแต่ละครั้ง
ดู webrecorder.net/browsertrix สำหรับภาพรวมคุณสมบัติและข้อมูลเกี่ยวกับวิธีการสมัครใช้บริการ Browsertrix ที่โฮสต์โดย Webrecorder
เอกสารฉบับเต็มสำหรับการใช้ ปรับใช้ และการพัฒนา Browsertrix มีอยู่ที่ docs.browsertrix.com
เอกสารของเราสร้างขึ้นด้วย Material สำหรับ MKDocs
เอกสารการปรับใช้ล่าสุดมีอยู่ที่ docs.browsertrix.com/deploy
เอกสารครอบคลุมถึงการปรับใช้ Browsertrix ในสภาพแวดล้อมที่แตกต่างกันโดยใช้ Kubernetes ตั้งแต่การตั้งค่าโหนดเดียวไปจนถึงคลัสเตอร์ที่ปรับขนาดได้ในระบบคลาวด์
ในช่วงแรก Browsertrix ยังรองรับ Docker Compose และการปรับใช้แบบอิงพ็อดแมนด้วย สิ่งนี้เลิกใช้งานแล้วเนื่องจากความซับซ้อนในการรักษาความเท่าเทียมกันของฟีเจอร์ในการตั้งค่าต่างๆ และมีตัวเลือกการใช้งาน Kubernetes ที่หลากหลายและปรับใช้ได้ง่าย แม้ในเครื่องเดียว
การทำให้ Browsertrix ใช้งานได้ง่ายที่สุดเท่าที่จะเป็นไปได้ยังคงเป็นเป้าหมายสำคัญ และเรายินดีรับข้อเสนอแนะเกี่ยวกับวิธีที่เราสามารถปรับปรุงตัวเลือกการใช้งาน Kubernetes ของเราให้ดียิ่งขึ้น
หากคุณต้องการลองใช้การรวบรวมข้อมูลเพียงครั้งเดียว คุณอาจต้องการลองใช้ Browsertrix Crawler ก่อนเพื่อทดสอบความสามารถในการรวบรวมข้อมูล
แม้ว่าระบบและ API แบ็กเอนด์จะค่อนข้างเสถียร แต่เรากำลังพัฒนาคุณสมบัติเพิ่มเติมมากมาย โปรดดูปัญหา GitHub และโครงการ GitHub นี้สำหรับแผนโครงการและงานปัจจุบันของเรา
คำแนะนำในการเริ่มต้นพัฒนาท้องถิ่นมีอยู่ที่ docs.browsertrix.com/develop
เราใช้ Weblate เพื่อจัดการการสนับสนุนการแปล
Browsertrix มีให้บริการภายใต้ใบอนุญาต AGPLv3
เอกสารประกอบมีให้ภายใต้ Creative Commons Attribution 4.0 International License