ดาวน์โหลด chat4u - ดาวน์โหลดซอร์สโค้ด chat4u

chat4u

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

Chat4U

ใช้บันทึกการแชท WeChat เพื่อฝึกแชทบอทที่เป็นเอกสิทธิ์สำหรับคุณ

รับคีย์ฐานข้อมูล

บันทึกการแชท WeChat จะถูกเข้ารหัสและจัดเก็บไว้ในฐานข้อมูล sqlite ขั้นแรก คุณต้องมีคีย์ฐานข้อมูล คุณต้องมีแล็ปท็อป macOS และโทรศัพท์มือถือของคุณสามารถเป็น Android/iPhone ได้

ซิงโครไนซ์บันทึกการแชท WeChat กับโน้ตบุ๊ก Mac: ไปที่การตั้งค่า > แชท > การย้ายและสำรองข้อมูลประวัติการแชท > โยกย้าย > โยกย้ายไปยังพีซี WeChat และเลือกบันทึกการแชทที่ต้องการซิงโครไนซ์
ดาวน์โหลดสคริปต์ dtrace ที่จัดทำโดย nalzok/wechat-decipher-macos

git clone https://github.com/nalzok/wechat-decipher-macos

เริ่ม WeChat บนคอมพิวเตอร์ อยู่ที่หน้าเข้าสู่ระบบ และดำเนินการคำสั่งต่อไปนี้

sudo ./wechat-decipher-macos/macos/dbcracker.d -p $( pgrep WeChat ) | tee dbtrace.log

หากคุณไม่ได้รับอนุญาต dtrace คุณจะต้องปิด SIP ชั่วคราว โปรดดูสิ่งนี้และดำเนินการตามคำแนะนำข้างต้นอีกครั้ง
เข้าสู่ระบบ WeChat บนคอมพิวเตอร์แล้วออกจาก WeChat คาดว่าคีย์ของฐานข้อมูล WeChat ทั้งหมดจะถูกแยกและบันทึกใน dbtrace.log ตัวอย่างมีดังนี้

 sqlcipher '/Users/<user>/Library/Containers/com.tencent.xinWeChat/Data/Library/Application Support/com.tencent.xinWeChat/2.0b4.0.9/5976edc4b2ac64741cacc525f229c5fe/Message/msg_0.db'
--------------------------------------------------------------------------------
PRAGMA key = "x'<384_bit_key>'";
PRAGMA cipher_compatibility = 3;
PRAGMA kdf_iter = 64000;
PRAGMA cipher_page_size = 1024;
........................................

ผู้ใช้ระบบปฏิบัติการอื่นสามารถลองใช้วิธีการต่อไปนี้ ซึ่งได้รับการวิจัยและไม่ได้รับการตรวจสอบเท่านั้น เพื่อใช้อ้างอิง:

แอนดรอยด์:
- สิทธิ์รูทในการส่งออก EnMicroMsg.db : https://github.com/ppwwyyxx/wechat-dump
- ดุร้ายบังคับคีย์ EnMicroMsg.db : https://github.com/chg-hou/EnMicroMsg.db-Password-Cracker
ไอโฟน:
- ใช้ iTunes เพื่อสำรองและส่งออก: https://github.com/BlueMatthew/WechatExporter
หน้าต่าง:
- https://bbs.kanxue.com/thread-251303.htm
- https://github.com/AdminTest0/SharpWxDump

ถอดรหัสฐานข้อมูล

บนแล็ปท็อป macOS ของฉัน บันทึกการแชท WeChat จะถูกจัดเก็บไว้ใน msg_0.db - msg_9.db และมีเพียงฐานข้อมูลเหล่านี้เท่านั้นที่สามารถถอดรหัสได้

คุณต้องติดตั้ง sqlcipher เพื่อถอดรหัส ผู้ใช้ระบบ macOS สามารถดำเนินการได้โดยตรง:

brew install sqlcipher

รันสคริปต์ต่อไปนี้เพื่อแยกวิเคราะห์ dbtrace.log ถอดรหัส msg_x.db และส่งออกไปยัง plain_msg_x.db โดยอัตโนมัติ

python3 decrypt.py

การประมวลผลข้อมูล

คุณสามารถเปิดฐานข้อมูลที่ถอดรหัสแล้ว plain_msg_x.db ผ่าน https://sqliteviewer.app/ ค้นหาตารางที่มีบันทึกการแชทที่คุณต้องการ กรอกชื่อฐานข้อมูลและตารางลงใน prepare_data.py และรันสคริปต์ต่อไปนี้เพื่อสร้าง ข้อมูลการฝึกอบรม train.json กลยุทธ์ปัจจุบันค่อนข้างง่าย จัดการบทสนทนาได้เพียงรอบเดียวเท่านั้น และจะรวมบทสนทนาที่ต่อเนื่องกันภายใน 5 นาที

python3 prepare_data.py

ตัวอย่างข้อมูลการฝึกอบรมมีดังนี้:

[
    { "instruction" : "你好" , "output" : "你好" }
    { "instruction" : "你是谁" , "output" : "你猜猜" }
]

การฝึกอบรมแบบจำลอง

เตรียมเครื่อง Linux ที่มี GPU และ scp train.json ให้กับเครื่อง GPU

ฉันใช้ LLaMA-7B การปรับแต่งแบบเต็มภาพแบบละเอียดของ stanford_alpaca และฝึกฝนข้อมูล 90,000 สำหรับ 3 ยุคบน V100-SXM2-32GB แบบ 8 การ์ด ซึ่งใช้เวลาเพียง 1 ชั่วโมงเท่านั้น

 # clone the alpaca repo
git clone https://github.com/tatsu-lab/stanford_alpaca.git && cd stanford_alpaca
# adjust deepspeed config ... such as disabling offloading
vim ./configs/default_offload_opt_param.json
# train with deepspeed zero3
torchrun --nproc_per_node=8 --master_port=23456 train.py 
    --model_name_or_path huggyllama/llama-7b 
    --data_path ../train.json 
    --model_max_length 128 
    --fp16 True 
    --output_dir ../llama-wechat 
    --num_train_epochs 3 
    --per_device_train_batch_size 8 
    --per_device_eval_batch_size 8 
    --gradient_accumulation_steps 1 
    --evaluation_strategy " no " 
    --save_strategy " epoch " 
    --save_total_limit 1 
    --learning_rate 2e-5 
    --weight_decay 0. 
    --warmup_ratio 0.03 
    --lr_scheduler_type " cosine " 
    --logging_steps 10 
    --deepspeed " ./configs/default_offload_opt_param.json " 
    --tf32 False

DeepSpeed zero3 จะบันทึกน้ำหนักเป็นชิ้น ๆ และจะต้องรวมเข้ากับไฟล์จุดตรวจ pytorch:

 cd llama-wechat
python3 zero_to_fp32.py . pytorch_model.bin

สำหรับกราฟิกการ์ดระดับผู้บริโภค คุณสามารถลองใช้อัลปาก้าลอร่าได้ การปรับแต่งน้ำหนักลอร่าแบบละเอียดเท่านั้นจึงจะสามารถลดต้นทุนหน่วยความจำกราฟิกและการฝึกอบรมได้อย่างมาก

การปรับใช้โมเดล

การดีบักส่วนหน้า

คุณสามารถใช้ alpaca-lora เพื่อปรับใช้ส่วนหน้าแบบไล่ระดับสีสำหรับการดีบัก หากเป็นการปรับแต่งรูปภาพทั้งหมดอย่างละเอียด คุณจะต้องใส่เครื่องหมายความคิดเห็นในโค้ดที่เกี่ยวข้องกับ peft และโหลดเฉพาะโมเดลพื้นฐานเท่านั้น

git clone https://github.com/tloen/alpaca-lora.git && cd alpaca-lora
CUDA_VISIBLE_DEVICES=0 python3 generate.py --base_model ../llama-wechat

ผลการดำเนินงาน:

การเข้าถึงวีแชท

จำเป็นต้องปรับใช้บริการโมเดลที่เข้ากันได้กับ OpenAI API ต่อไปนี้เป็นการปรับเปลี่ยนอย่างง่ายโดยยึดตาม llama4openai-api.py ดู llama4openai-api.py ในคลังข้อมูลนี้เพื่อเริ่มบริการ:

CUDA_VISIBLE_DEVICES=0 python3 llama4openai-api.py

ทดสอบว่าอินเทอร์เฟซพร้อมใช้งานหรือไม่:

curl http://127.0.0.1:5000/chat/completions -v -H " Content-Type: application/json " -H " Authorization: Bearer $OPENAI_API_KEY " --data ' {"model":"llama-wechat","max_tokens":128,"temperature":0.95,"messages":[{"role":"user","content":"你好"}]} '

ใช้ wechat-chatgpt เพื่อเข้าถึง WeChat และกรอกที่อยู่บริการรุ่นท้องถิ่นของคุณสำหรับที่อยู่ API:

docker run -it --rm --name wechat-chatgpt 
    -e API=http://127.0.0.1:5000 
    -e OPENAI_API_KEY= $OPENAI_API_KEY 
    -e MODEL= " gpt-3.5-turbo " 
    -e CHAT_PRIVATE_TRIGGER_KEYWORD= " " 
    -v $( pwd ) /data:/app/data/wechat-assistant.memory-card.json 
    holegots/wechat-chatgpt:latest

ผลการดำเนินงาน:

“เพิ่งเชื่อมต่อ” เป็นประโยคแรกที่หุ่นยนต์พูด และอีกฝ่ายก็เดาไม่ออกจนจบ

โดยทั่วไปแล้ว หุ่นยนต์ที่ได้รับการฝึกด้วยบันทึกการแชทย่อมมีข้อผิดพลาดสามัญสำนึกบางประการอย่างหลีกเลี่ยงไม่ได้ แต่พวกมันจะเลียนแบบรูปแบบการแชทได้ดีกว่า

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2024-12-13
ขนาด 150.91KB
มาจาก Github

แอปที่เกี่ยวข้อง

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
node telegram bot api

โค้ดแหล่งที่มา AI

v0.50.0
typebot.io

โค้ดแหล่งที่มา AI

v3.1.2
python wechaty getting started

โค้ดแหล่งที่มา AI

1.0.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด