Penganalisis Tangkapan Layar GPT-4V
Keterangan
Penganalisis Tangkapan Layar GPT-4V adalah alat yang mengintegrasikan kemampuan API Visi GPT-4 OpenAI ke dalam cara interaktif untuk menganalisis dan memahami tangkapan layar Anda. Tangkapan layar dianalisis oleh GPT-4V untuk memberikan deskripsi mendetail. Selain itu, alat ini mendukung dialog interaktif, memungkinkan pengguna mengajukan pertanyaan lanjutan tentang tangkapan layar untuk informasi lebih mendalam.
Fitur
- Analisis Gambar : Memanfaatkan GPT-4 Vision API untuk menganalisis dan mendeskripsikan tangkapan layar.
- Dialog Interaktif : Terlibat dalam obrolan dengan AI tentang tangkapan layar untuk mendapatkan wawasan mendetail dan pertanyaan lanjutan.
- Antarmuka yang Ramah Pengguna : GUI sederhana untuk melihat tangkapan layar dan berinteraksi dengan AI.
Instalasi (Diuji pada Ubuntu 20.04)
Kloning Repositori
git clone https://github.com/jeremy-collins/gpt4v-screenshot-analyzer.git
Instal Dependensi
- Pastikan Python 3 diinstal.
- Instal perpustakaan Python yang diperlukan:
pip install -r requirements.txt
Siapkan Kunci API OpenAI
- Dapatkan kunci API dari OpenAI.
- Tetapkan kunci API OpenAI Anda sebagai variabel lingkungan:
echo 'export OPENAI_API_KEY=<put your key here>' >> ~/.bashrc
- Alternatifnya, Anda dapat menyetel variabel api_key di dalam gpt4v_screenshot_analyzer.py ke kunci OpenAI Anda, tetapi ini merupakan risiko keamanan.
Pengaturan Layanan Systemd (Opsional)
- Pertama, buat file gpt4_screenshot_analyzer.py dapat dieksekusi:
sudo chmod +x gpt4_screenshot_analyzer.py
- Kemudian, sesuaikan file gpt4-screenshot.service dengan kebutuhan Anda.
- Anda perlu mengubah jalur ke file gpt4_screenshot_analyzer.py di dalam baris ExecStart.
- Anda mungkin juga perlu mengubah nomor tampilan di baris Lingkungan.
- Terakhir, Anda mungkin ingin mengubah baris Pengguna.
- Untuk menjalankan aplikasi sebagai layanan yang akan dimulai saat boot, ikuti langkah-langkah berikut:
sudo cp gpt4-screenshot.service /etc/systemd/system/
sudo systemctl enable gpt4-screenshot
sudo systemctl start gpt4-screenshot
- Jika ini tidak berhasil, Anda dapat men-debug layanan dengan menjalankan:
sudo systemctl status gpt4-screenshot
- Perintah-perintah ini mungkin juga berguna:
sudo systemctl daemon-reload
sudo systemctl stop gpt4-screenshot
sudo systemctl restart gpt4-screenshot
sudo systemctl disable gpt4-screenshot
Mengaktifkan Akses Tampilan saat Startup (opsional)
- Untuk mengaktifkan akses tampilan saat startup, buka Aplikasi Startup (Ubuntu) dan tambahkan Program Startup dengan perintah berikut:
path/to/repo/gpt4v-screenshot-analyzer/enable_xhost.sh
Penggunaan
- Mulai aplikasi (Anda dapat melewati langkah ini jika mengikuti langkah 4 dan 5):
python3 gpt4_screenshot_analyzer.py
- Gunakan tombol pintas
Ctrl+Alt+S
untuk memulai pengambilan tangkapan layar. - Seret untuk memilih area yang ingin Anda tangkap.
- GPT-4V akan menganalisis tangkapan layar dan menampilkan hasilnya di jendela GUI.
- Gunakan kotak teks di GUI untuk mengajukan pertanyaan lanjutan.
Berkontribusi
Kontribusi dipersilahkan! Jika Anda ingin berkontribusi, silakan fork repositori dan gunakan cabang fitur. Permintaan tarik dipersilakan.
Lisensi
Proyek ini dilisensikan di bawah Lisensi MIT - lihat file LISENSI untuk detailnya.
Kredit
Dikembangkan oleh Jeremy A. Collins. Terima kasih khusus kepada OpenAI yang telah menyediakan GPT-4 Vision API.