หุ่นยนต์ค้นหาแชทกลุ่มและเก็บถาวร Telegram เหมาะสำหรับสภาพแวดล้อม CJK
คลิกปุ่ม [ค้นหา] เพื่อตรวจสอบสิทธิ์และเปิดอินเทอร์เฟซการค้นหาโดยอัตโนมัติ
คลิกลิงก์เวลาเพื่อข้ามไปยังอินเทอร์เฟซการแชท
คุณต้อง:
ดาวน์โหลดไฟล์ .env.example
อ้างอิงความคิดเห็นภายใน และกำหนดค่าตามนั้น
คุณสามารถบันทึกเป็น .env
หรือกำหนดค่าเป็นตัวแปรสภาพแวดล้อมได้
TAS ไม่มีบริการ https ในตัว ขอแนะนำให้ใช้แคดดี้หรือซอฟต์แวร์ที่คล้ายกันเพื่อย้อนกลับพร็อกซี TAS
docker run -d --restart=always --env-file=.env quay.io/oott123/telegram-archive-server
แน่นอน คุณสามารถรันโดยใช้ Kubernetes หรือ docker-compose ได้
หากคุณไม่มี Docker หรือไม่ต้องการใช้ Docker คุณสามารถคอมไพล์และปรับใช้จากซอร์สโค้ดได้ ณ จุดนี้คุณยังต้องการ:
git clone https://github.com/oott123/telegram-archive-server.git
cd telegram-archive-server
# git checkout vX.X.X
cp .env.example .env
vim .env
yarn
yarn build
yarn start
ส่ง /search
ในกลุ่ม บอทอาจแจ้งให้คุณตั้งค่าโดเมน เพียงปฏิบัติตามคำแนะนำ
ผู้ใช้จะต้องมีคุณสมบัติตรงตามเกณฑ์ต่อไปนี้เพื่อให้อวตารของตนปรากฏในผลการค้นหา:
เนื่องจาก MeiliSearch มีประสิทธิภาพในการจัดทำดัชนีข้อความใหม่ต่ำ ข้อความจะเข้าสู่ดัชนีเมื่อตรงตามเงื่อนไขข้อใดข้อหนึ่งต่อไปนี้เท่านั้น:
หากไม่ได้ใช้ Redis เพื่อคงคิวข้อความ ข้อความที่ไม่ได้เข้าสู่คิวอาจสูญหายเมื่อโปรแกรมทำงานผิดปกติหรือรีสตาร์ทเซิร์ฟเวอร์
ขณะนี้รองรับการนำเข้ากลุ่มซูเปอร์กรุ๊ปเท่านั้น
คลิกปุ่มสามจุดบนไคลเอนต์เดสก์ท็อป - ส่งออกประวัติการแชท รอให้การส่งออกเสร็จสิ้น และรับ result.json
ดำเนินการ:
curl
-H " Content-Type: application/json "
-H " Authorization: Bearer $AUTH_IMPORT_TOKEN "
-XPOST -T result.json
http://localhost:3100/api/v1/import/fromTelegramGroupExport
สามารถนำเข้าบันทึกได้ โปรดทราบว่าสามารถนำเข้าได้เฉพาะบันทึกจากกลุ่มเดียวในแต่ละครั้ง
หากคุณเปิดใช้งานคิว OCR จำเป็นต้องมี Redis (สามารถแชร์อินสแตนซ์กับแคชได้) และกำหนดค่าบริการการจดจำของบริษัทอื่น กระบวนการระบุตัวตนมีดังนี้:
การรับรู้และการจัดเก็บสามารถดำเนินการได้บนอินสแตนซ์บทบาทที่แตกต่างกัน: การดาวน์โหลดรูปภาพและการจัดเก็บข้อความจะเสร็จสิ้นบนอินสแตนซ์ Bot และอินสแตนซ์ OCR จำเป็นต้องเข้าถึงบริการ OCR เท่านั้น
การออกแบบนี้ช่วยให้ผู้ดูแลสามารถออกแบบการระบุตัวตนแบบออฟไลน์แบบรวมศูนย์ (เช่น ใช้อินสแตนซ์ที่ยอมให้มีการขัดจังหวะชั่วคราวเพื่อเรียกใช้บริการการระบุตัวตนและปิดระบบหลังจากเคลียร์คิวแล้ว) เพื่อลดต้นทุนการระบุตัวตน
หากคุณใช้บริการคลาวด์ของบริษัทอื่น คุณสามารถปิดคิว OCR ได้โดยตรง หรือเปิดใช้งานบทบาท Bot และ OCR ในอินสแตนซ์เดียวกัน
โปรดดูเอกสารการจดจำข้อความของ Google Cloud Vision และกฎการเรียกเก็บเงินของ Google Cloud Vision การกำหนดค่ามีดังนี้:
OCR_DRIVER=google
OCR_ENDPOINT=eu-vision.googleapis.com # 或者 us-vision.googleapis.com ,决定 Google 在何处存储处理数据
GOOGLE_APPLICATION_CREDENTIALS=/path/to/google/credentials.json # 从 GCP 后台下载的 json 鉴权文件
คุณต้องมีอินสแตนซ์ของ Paddleocr-web การกำหนดค่ามีดังนี้:
OCR_DRIVER=paddle-ocr-web
OCR_ENDPOINT=http://127.0.0.1:8980/api
สร้างทรัพยากร Azure Vision และกำหนดค่าข้อมูลทรัพยากรดังต่อไปนี้:
OCR_DRIVER=azure
OCR_ENDPOINT=https://tas.cognitiveservices.azure.com
OCR_CREDENTIALS=000000000000000000000000000000000
docker run [...] dist/main ocr,bot
# or
node dist/main ocr,bot
DEBUG=app: * ,grammy * yarn start:debug
หลังจากที่บริการค้นหาได้รับการรับรองความถูกต้องแล้ว เซิร์ฟเวอร์จะข้ามไปที่: $HTTP_UI_URL/index.html
พร้อมด้วยพารามิเตอร์ URL ต่อไปนี้:
tas_server
- URL ฐานเซิร์ฟเวอร์ ในรูปแบบ http://localhost:3100/api/v1
tas_indexName
- หมายเลขกลุ่มในรูปแบบของ supergroup1234567890
tas_authKey
- JWT ออกโดยเซิร์ฟเวอร์ ซึ่งสามารถใช้เป็นคีย์ API ของ MeiliSearch /api/v1/search/compilable/meili
สามารถค้นหาได้เหมือนกับอินสแตนซ์ MeiliSearch ปกติ
ชื่อดัชนีควรใช้หมายเลขกลุ่มในรูปแบบของ supergroup1234567890
คีย์ API คือ JWT ที่ออกโดยเซิร์ฟเวอร์
โปรดทราบว่าตัวกรองไม่สามารถใช้งานได้ชั่วคราวด้วยเหตุผลด้านความปลอดภัย