Untuk versi serupa untuk smartwatch Android Anda, lihat repo saya yang lain-GPT-bantuan-minat. Proyek ini memanfaatkan API Asisten Openai.
(Dibuat untuk mesin penyelesaian lama dan dipasang untuk chatgpt. Tidak sebagus barang modern. Terus mencari.)
Ini adalah bot yang memungkinkan Anda untuk melakukan percakapan lisan yang menarik dan emosional dengan chatgpt atau GPT-4 menggunakan mikrofon Anda. Jika Anda lebih suka mengetik daripada berbicara, Anda juga dapat berkomunikasi dengan bot melalui terminal.
Alat ini menggunakan preset obrolan GPT yang dimodifikasi, menangani melacak percakapan, dan menggunakan API ChatGPT secara default. Anda dapat memberi tahu GPT sesuatu dan itu akan mengingat apa yang Anda katakan untuk sesi ini dan Anda juga dapat meminta bot mengembangkan kenangan Anda dari waktu ke waktu jika Anda mau. Terlepas dari keterbatasan berdasarkan jumlah token Max GPT, GPT-VCC harus tetap dapat berkomunikasi dengan Anda selama yang Anda inginkan tanpa kehilangan kesadaran tentang apa yang telah Anda bicarakan. Untuk menggunakan alat ini, Anda akan memerlukan kunci API OpenAI yang valid.
Bot membutuhkan moderasi Openai dan API GPT untuk bekerja dengan baik tanpa terlalu banyak latensi. Anda dapat menemukan statusnya di sini: https://status.openai.com/
Rilis harus stabil, sejauh pengujian sebelumnya, tetapi tidak akan memiliki semua fitur terbaru. Jika Anda ingin memiliki semua fitur seperti yang tercantum di sini, klon repositori dan jalankan 'Git Pull' sesekali. Ini akan memberi Anda fitur terbaru dan perbaikan bug saat mereka datang, tetapi bisa tidak stabil.
(Catatan: Wisetech adalah nama instance bot saya dipilih untuk dirinya sendiri)
Pertama, Anda memerlukan kunci API Openai. Anda dapat membuat akun untuk mendapatkan kunci API di sini: https://openai.com/api/.
Setelah Anda masuk, tekan lingkaran di sebelah teks "pribadi" di sudut kanan atas. Kemudian tekan "Lihat Kunci API".
Tekan "Buat Kunci Rahasia Baru", lalu simpan tombol itu. Itulah kunci yang Anda perlukan untuk menjalankan GPT-VCC. Tempel di file txt Keys termasuk dengan cara berikut:
OpenAI_Key={paste here without brackets}
Pergi ke tab "penagihan" di sebelah kiri layar. Mulai paket pembayaran saat Anda kehabisan kredit gratis untuk terus menggunakan GPT-VCC.
Unduh Python di https://www.python.org/
Unduh repo ini baik melalui rilis, git mengkloning repo, atau menekan tombol kode ke kanan atas dan menekan "unduh zip".
Ekstrak konten, lalu pindahkan ke folder dengan file.
Jika Anda memiliki terminal Windows yang diinstal, klik kanan bagian kosong folder dan pilih 'Open in Terminal'. Jika tidak, gunakan Win + R dan masukkan PowerShell. Setelah Anda berada di jendela terminal dan di direktori yang tepat, gunakan "Pip Install -R persyaratan.txt - -upgrade". Jika ini berhasil dilakukan, Anda harus siap untuk pergi segera setelah Anda mendapatkan kunci API OpenAI.
Ikuti langkah-langkah yang tercantum dalam menggunakan GPT-VCC
Pasang PIP3
sudo apt install python3-pip
Unduh repo ini baik melalui rilis, git mengkloning repo, atau menekan tombol kode ke kanan atas dan menekan "unduh zip".
Ekstrak file, pindah ke direktori, buka persyaratan.txt, dan hapus pyaudio == 0.2.13 dari file. Jadikan itu terlihat seperti tidak pernah ada di sana, melestarikan format aslinya.
Unduh pyaudio dengan apt sebagai berikut:
sudo apt install python3-pyaudio
Unduh Espeak dengan APT sebagai berikut (diperlukan untuk komunikasi antarmuka):
sudo apt install espeak
Unduh persyaratan lain dengan PIP sebagai berikut:
pip3 install -r requirements.txt --upgrade
Ikuti langkah-langkah yang tercantum dalam menggunakan GPT-VCC
Untuk menggunakan chatbot ini, masukkan perintah berikut setelah Anda menavigasi ke folder bot (mengganti <yyy> dengan kunci API Anda):
python main.py <key>
Untuk kenyamanan, Anda juga dapat memasukkan kunci ke dalam file Keys.txt. Saat Anda menjalankan skrip, bot akan secara otomatis membaca file ini dan memuat kunci.
Pygame GUI akan muncul; Warnanya mewakili keadaan bot. Warna merah menunjukkan bahwa bot tidak mendengarkan. Untuk membuat bot mendengarkan Anda, tekan ruang. Warnanya akan berubah menjadi kuning saat memuat, lalu hijau saat mendengarkan. Bicaralah dengan bebas ketika warnanya hijau, pidato Anda akan direkam, dikonversi menjadi teks, kemudian diumpankan ke GPT jika sesuai dengan kebijakan Openai. Ketika GPT siap membalas, layar akan menjadi biru.
Jika Anda ingin menggunakan terminal, jalankan gptcli.py sebagai gantinya menggunakan sintaks yang sama (memiliki keyfile juga berfungsi):
python gptcli.py <key>
Jika Anda ingin menggunakan ElevenLabs TTS, Anda harus memasukkan kunci API ElevenLabs pribadi Anda mengikuti kunci API OpenAI Anda sebagai berikut atau mengisi kunci dalam file kunci:
python main.py <OpenAI key> <ElevenLabs TTS key>
Jika Anda tidak ingin menggunakan TTS mewah, bot ini akan secara otomatis menggunakan TT Google.
Moderasi menggunakan alat moderasi OpenAI dan NLTK. Gabungan, mereka berharap dapat mencegah penggunaan GPT yang berada di luar kebijakan penggunaan Openai. Ini bukan metode yang tidak dapat ditentukan, jadi harap berhati -hati dengan apa yang Anda berikan GPT.
Harap dicatat bahwa masalah pemadaman atau latensi dengan API moderasi akan mencegah Anda menggunakan chatbot ini. Jika Anda harus berbicara dengan bot saat Openai mengalami masalah, silakan edit file chatbot.py untuk mengecualikan kondisi "not self.flagged_by_openai (teks)". Saya tidak merekomendasikan ini.
Anda sekarang dapat menggunakan suara alternatif jika Anda ingin menggunakan argumen yang disahkan saat memulai program. Di masa depan cara yang lebih disempurnakan untuk melakukan ini direncanakan. Untuk saat ini, Anda harus mengetahui ID suara yang ingin Anda gunakan (Anda dapat menemukan daftar ID suara dasar di sini). Setelah Anda mengetahui ID itu, gunakan sebagai berikut dengan contoh ID "21M00TCM4TLVDQ8IKWAM" untuk Rachel:
python main.py --voice_id 21m00Tcm4TlvDq8ikWAM
Untuk menggunakan suara kloning, lakukan hal berikut:
Pergi ke lab suara di https://beta.elevenlabs.io/voice-lab dan buat suara khusus.
Setelah Anda memiliki suara yang dikloning, buka di sini https://api.elevenlabs.io/docs#/voices/get_voices_v1_voices_get.
Tekan "Coba", masukkan tombol API Anda ke dalam kotak, lalu tekan "Execute".
Di bawah tombol Execute, Anda akan melihat kotak berlabel "Badan Respons". Gulir ke bawah dalam kotak ini sampai Anda menemukan suara yang Anda beri nama. Dapatkan "voice_id" yang tepat di atasnya, dan gunakan seperti pada contoh di atas.
Spacebar : Ini dimulai dan menghentikan rekaman. Apa pun yang Anda katakan akan ditranskripsi dan dikirim ke GPT (jika melewati filter) setelah Anda menekan ruang untuk kedua kalinya.
Escape : Ini keluar tanpa menghafal.
T : Ini berhenti dan memiliki bot ingat detail tentang Anda dan percakapan Anda (data disimpan dalam file teks yang disebut memori.txt)
P : Ini adalah perintah yang didepresiasi untuk membatalkan pesan. Sekarang katakan saja, "Harap batalkan pesan" saat merekam untuk membatalkan.
Katakan 'Harap atur token ke #' : Ketika bot mengenali frasa ini, ia akan mencoba mengatur max_tokens dari balasan untuk nilai yang Anda tentukan.
Katakanlah 'Bicaralah Like A Robot' : Ini akan menetapkan semua tanggapan dari GPT untuk diucapkan dengan program TTS robot yang bekerja secara offline. Dalam mode CLI, masukkan '! Robospeak ()' untuk beralih mode ini.
Katakan 'Berhenti Berbicara Seperti Robot' : Ini akan mengembalikan TTS bot ke apa pun yang Anda miliki sebelumnya (baik Google atau Elevenlabs TTS). Dalam mode CLI, masukkan '! Robospeak ()' untuk beralih mode ini.
Katakan 'tolong tampilkan percakapan' : Ini akan menghasilkan seluruh percakapan Anda ke jendela terminal.
Katakan 'Harap Tampilkan Kenangan' : Ini akan memberikan output dari semua kenangan yang disimpan ke dalam penyimpanan jangka panjang.
Katakanlah 'Harap kembalikan memori' : Ini akan berusaha memperbaiki memori kerja bot dengan mengkonsolidasikan sejumlah kenangan dari penyimpanan jangka panjang.
Katakan 'Harap atur preset ke' : Ini akan mengatur preset (string teks yang diberikan kepada AI pada awal setiap percakapan) untuk bot. Misalnya, preset 'berbicara seperti bajak laut' membuat AI berbicara seperti bajak laut. Anda dapat menemukan contoh preset di sini: https://github.com/adri6336/gpt-voice-conversation-ratbot/wiki/example-presets.
Katakan 'Harap Reset Preset' : Ini akan menghapus preset yang Anda buat.
Katakan 'Harap atur nama ke' : Ini akan mengatur nama bot ke apa pun yang Anda tentukan, asalkan sesuai dengan kebijakan penggunaan Openai. Setelah mengatur nama, bot akan merujuk pada dirinya sendiri dengan nama yang Anda atur.
Katakan 'Mohon Takkan GPT4' : Ini akan beralih antara model ChatGPT dan GPT-4. Saat memulai, sakelar Anda akan dilestarikan. Dalam mode CLI, masukkan '! Gpt4 ()' untuk beralih model.
Katakan 'Harap atur kreativitas ke' : Ini akan mengatur keacakan default bot ke nilai yang Anda tentukan antara 1 dan 15 (dulu 9). Dalam mode CLI, gunakan '! Kreativitas ( #)' di mana tanda # adalah nilai antara 0,01 dan 1,5.
Katakan 'Harap Daftar Perintah' : Ini akan memiliki daftar bot dari perintah yang tersedia untuk Anda.
Katakan 'Mohon Toggle Elevenlabs' : Ini akan beralih dari penggunaan dan mematikan Bot dari Bot. Dalam mode CLI, gunakan! 11ai () untuk beralih.
Katakan 'Harap Batalkan Pesan' : Ini akan membatalkan pesan, mencegahnya dikirim ke GPT.
Melakukan percakapan yang dipersonalisasi dengan chatgpt atau gpt-4
Dengarkan GPT Bicaralah dengan Anda dengan alat TTS Google (akan mengucapkan aksen secara akurat jika bisa), dalam TT seperti Elevenlab (jika Anda memiliki kunci API yang valid), atau sebagai robot (katakanlah "Bicaralah seperti robot" untuk diaktifkan)
Bicaralah dengan GPT Outloud Menggunakan Teknologi Pengenalan Pidato Google
Bot akan mengingat hal -hal tentang Anda jika Anda menutup dengan kunci 'Q'
Lihat balasan GPT sebagai teks di jendela terminal. Kebanyakan karakter UTF-32 (seperti teks Cina dan Arab) juga akan dicetak
Secara otomatis menyimpan percakapan ke file di disk Anda untuk membantu Anda melacak apa yang telah Anda bicarakan
Simpan preset khusus untuk memiliki pengalaman yang lebih cocok untuk Anda dan kebutuhan Anda
Sesuaikan nama bot
Sesuaikan kreativitas bot
Obrolan dengan GPT melalui terminal (Windows dan Linux)
Berkomunikasi dengan bot secara rekreasi
Gunakan bot untuk mempraktikkan bahasa dengan pengaturan yang ditetapkan untuk berbicara dengan Anda dalam bahasa itu seperti guru dan mendengar tanggapan dengan pengumuman yang tepat menggunakan TT Google. Jika Anda lebih suka, Anda juga dapat tetap dengan suara multibahasa Elevenlabs
Mintalah bot membantu Anda berlatih pemrograman dengan mengajukan pertanyaan kepada Anda dan memberikan umpan balik pada kode Anda
Ajukan pertanyaan bot tentang berbagai hal yang muncul
Minta bot untuk membantu Anda menulis surat pengantar dan deskripsi
Demonstrasi Suara ElevenLabs
Demonstrasi Suara Spanyol Google TTS