เครื่องวิเคราะห์ภาพหน้าจอ GPT-4V
คำอธิบาย
เครื่องวิเคราะห์ภาพหน้าจอ GPT-4V เป็นเครื่องมือที่ผสานรวมความสามารถของ GPT-4 Vision API ของ OpenAI เข้ากับวิธีเชิงโต้ตอบเพื่อวิเคราะห์และทำความเข้าใจภาพหน้าจอของคุณ ภาพหน้าจอได้รับการวิเคราะห์โดย GPT-4V เพื่อให้คำอธิบายโดยละเอียด นอกจากนี้ เครื่องมือนี้ยังรองรับบทสนทนาเชิงโต้ตอบ ทำให้ผู้ใช้สามารถถามคำถามติดตามเกี่ยวกับภาพหน้าจอเพื่อดูข้อมูลเชิงลึกเพิ่มเติม
คุณสมบัติ
- การวิเคราะห์รูปภาพ : ใช้ GPT-4 Vision API เพื่อวิเคราะห์และอธิบายภาพหน้าจอ
- บทสนทนาแบบโต้ตอบ : มีส่วนร่วมในการสนทนากับ AI เกี่ยวกับภาพหน้าจอเพื่อดูข้อมูลเชิงลึกโดยละเอียดและคำถามติดตามผล
- ส่วนต่อประสานที่ใช้งานง่าย : GUI อย่างง่ายสำหรับการดูภาพหน้าจอและการโต้ตอบกับ AI
การติดตั้ง (ทดสอบบน Ubuntu 20.04)
โคลนพื้นที่เก็บข้อมูล
git clone https://github.com/jeremy-collins/gpt4v-screenshot-analyzer.git
ติดตั้งการพึ่งพา
- ตรวจสอบให้แน่ใจว่าติดตั้ง Python 3 แล้ว
- ติดตั้งไลบรารี Python ที่จำเป็น:
pip install -r requirements.txt
ตั้งค่าคีย์ OpenAI API
- รับคีย์ API จาก OpenAI
- ตั้งค่าคีย์ OpenAI API ของคุณเป็นตัวแปรสภาพแวดล้อม:
echo 'export OPENAI_API_KEY=<put your key here>' >> ~/.bashrc
- หรือคุณสามารถตั้งค่าตัวแปร api_key ภายใน gpt4v_screenshot_analyzer.py ให้เป็นคีย์ OpenAI ของคุณได้ แต่นี่ถือเป็นความเสี่ยงด้านความปลอดภัย
การตั้งค่าบริการ Systemd (ไม่บังคับ)
- ขั้นแรก ทำให้ไฟล์ gpt4_screenshot_analyzer.py ปฏิบัติการได้:
sudo chmod +x gpt4_screenshot_analyzer.py
- จากนั้นปรับแต่งไฟล์ gpt4-screenshot.service ตามความต้องการของคุณ
- คุณจะต้องเปลี่ยนเส้นทางไปยังไฟล์ gpt4_screenshot_analyzer.py ภายในบรรทัด ExecStart
- คุณอาจต้องเปลี่ยนหมายเลขที่แสดงในบรรทัดสภาพแวดล้อม
- สุดท้ายนี้ คุณอาจต้องการเปลี่ยนบรรทัดผู้ใช้
- หากต้องการเรียกใช้แอปพลิเคชันเป็นบริการที่จะเริ่มต้นขณะบูต ให้ทำตามขั้นตอนเหล่านี้:
sudo cp gpt4-screenshot.service /etc/systemd/system/
sudo systemctl enable gpt4-screenshot
sudo systemctl start gpt4-screenshot
- หากไม่ได้ผล คุณสามารถแก้ไขข้อบกพร่องของบริการได้โดยการเรียกใช้:
sudo systemctl status gpt4-screenshot
- คำสั่งเหล่านี้อาจมีประโยชน์เช่นกัน:
sudo systemctl daemon-reload
sudo systemctl stop gpt4-screenshot
sudo systemctl restart gpt4-screenshot
sudo systemctl disable gpt4-screenshot
การเปิดใช้งานการเข้าถึงการแสดงผลเมื่อเริ่มต้น (ตัวเลือก)
- หากต้องการเปิดใช้งานการเข้าถึงการแสดงผลเมื่อเริ่มต้น ให้เปิดแอปพลิเคชันเริ่มต้น (Ubuntu) และเพิ่มโปรแกรมเริ่มต้นด้วยคำสั่งต่อไปนี้:
path/to/repo/gpt4v-screenshot-analyzer/enable_xhost.sh
การใช้งาน
- เริ่มแอปพลิเคชัน (คุณสามารถข้ามขั้นตอนนี้หากคุณทำตามขั้นตอนที่ 4 และ 5):
python3 gpt4_screenshot_analyzer.py
- ใช้ปุ่มลัด
Ctrl+Alt+S
เพื่อเริ่มการจับภาพหน้าจอ - ลากเพื่อเลือกพื้นที่ที่คุณต้องการจับภาพ
- GPT-4V จะวิเคราะห์ภาพหน้าจอและแสดงผลลัพธ์ในหน้าต่าง GUI
- ใช้กล่องข้อความใน GUI เพื่อถามคำถามติดตามผล
มีส่วนร่วม
ยินดีบริจาค! หากคุณต้องการมีส่วนร่วม โปรดแยกพื้นที่เก็บข้อมูลและใช้สาขาฟีเจอร์ ยินดีต้อนรับคำขอดึง
ใบอนุญาต
โครงการนี้ได้รับอนุญาตภายใต้ใบอนุญาต MIT - ดูรายละเอียดในไฟล์ใบอนุญาต
เครดิต
พัฒนาโดยเจเรมี เอ. คอลลินส์ ขอขอบคุณเป็นพิเศษสำหรับ OpenAI ที่ให้บริการ GPT-4 Vision API