محلل لقطة الشاشة GPT-4V
وصف
يعد GPT-4V Screenshot Analyzer أداة تدمج إمكانات واجهة برمجة تطبيقات GPT-4 Vision API الخاصة بـ OpenAI في طريقة تفاعلية لتحليل لقطات الشاشة وفهمها. يتم تحليل لقطات الشاشة بواسطة GPT-4V لتقديم وصف تفصيلي. بالإضافة إلى ذلك، تدعم هذه الأداة الحوار التفاعلي، مما يتيح للمستخدمين طرح أسئلة متابعة حول لقطات الشاشة للحصول على معلومات أكثر تفصيلاً.
سمات
- تحليل الصور : استخدم GPT-4 Vision API لتحليل لقطات الشاشة ووصفها.
- الحوار التفاعلي : شارك في محادثة مع الذكاء الاصطناعي حول لقطة الشاشة للحصول على رؤى تفصيلية وأسئلة المتابعة.
- واجهة سهلة الاستخدام : واجهة مستخدم رسومية بسيطة لعرض لقطات الشاشة والتفاعل مع الذكاء الاصطناعي.
التثبيت (تم اختباره على Ubuntu 20.04)
استنساخ المستودع
git clone https://github.com/jeremy-collins/gpt4v-screenshot-analyzer.git
تثبيت التبعيات
- تأكد من تثبيت بايثون 3.
- تثبيت مكتبات بايثون المطلوبة:
pip install -r requirements.txt
قم بإعداد مفتاح OpenAI API
- احصل على مفتاح API من OpenAI.
- قم بتعيين مفتاح OpenAI API الخاص بك كمتغير بيئة:
echo 'export OPENAI_API_KEY=<put your key here>' >> ~/.bashrc
- وبدلاً من ذلك، يمكنك تعيين المتغير api_key داخل gpt4v_screenshot_analyzer.py على مفتاح OpenAI الخاص بك، ولكن هذا يمثل خطرًا أمنيًا.
إعداد خدمة Systemd (اختياري)
- أولاً، اجعل الملف gpt4_screenshot_analyzer.py قابلاً للتنفيذ:
sudo chmod +x gpt4_screenshot_analyzer.py
- ثم قم بتخصيص ملف gpt4-screenshot.service حسب احتياجاتك.
- ستحتاج إلى تغيير المسار إلى ملف gpt4_screenshot_analyzer.py داخل سطر ExecStart.
- قد تحتاج أيضًا إلى تغيير رقم العرض في سطر البيئة.
- وأخيرًا، قد ترغب في تغيير خط المستخدم.
- لتشغيل التطبيق كخدمة ليتم تشغيلها عند التمهيد، اتبع الخطوات التالية:
sudo cp gpt4-screenshot.service /etc/systemd/system/
sudo systemctl enable gpt4-screenshot
sudo systemctl start gpt4-screenshot
- إذا لم ينجح ذلك، يمكنك تصحيح أخطاء الخدمة عن طريق تشغيل:
sudo systemctl status gpt4-screenshot
- قد تكون هذه الأوامر مفيدة أيضًا:
sudo systemctl daemon-reload
sudo systemctl stop gpt4-screenshot
sudo systemctl restart gpt4-screenshot
sudo systemctl disable gpt4-screenshot
تمكين الوصول إلى العرض عند بدء التشغيل (اختياري)
- لتمكين الوصول إلى العرض عند بدء التشغيل، افتح تطبيقات بدء التشغيل (Ubuntu) وأضف برنامج بدء التشغيل باستخدام الأمر التالي:
path/to/repo/gpt4v-screenshot-analyzer/enable_xhost.sh
الاستخدام
- ابدأ تشغيل التطبيق (يمكنك تخطي هذه الخطوة إذا اتبعت الخطوتين 4 و5):
python3 gpt4_screenshot_analyzer.py
- استخدم مفتاح التشغيل السريع
Ctrl+Alt+S
لبدء التقاط لقطة الشاشة. - اسحب لتحديد المنطقة التي تريد التقاطها.
- سيقوم GPT-4V بتحليل لقطة الشاشة وعرض النتائج في نافذة واجهة المستخدم الرسومية.
- استخدم مربع النص في واجهة المستخدم الرسومية لطرح أسئلة المتابعة.
المساهمة
المساهمات هي موضع ترحيب! إذا كنت ترغب في المساهمة، يرجى تفرع المستودع واستخدام فرع الميزات. طلبات السحب هي موضع ترحيب.
رخصة
هذا المشروع مرخص بموجب ترخيص MIT - راجع ملف الترخيص للحصول على التفاصيل.
الاعتمادات
تم تطويره بواسطة جيريمي أ. كولينز. شكر خاص لشركة OpenAI لتوفير GPT-4 Vision API.