Interaksi suara yang mulus dan real-time dengan AI.
Petunjuk: Siapa pun yang tertarik dengan solusi suara canggih, harap juga melihat Linguflex . Ini memungkinkan Anda mengendalikan lingkungan Anda dengan berbicara dan merupakan salah satu asisten open-source yang paling mampu dan canggih saat ini tersedia.
Menggunakan Faster_Whisper dan Elevenlabs Input Streaming untuk respons latensi rendah terhadap input lisan.
? Tonton video demo
Catatan : Demo dilakukan pada koneksi 10mbit/s, sehingga kinerja aktual mungkin lebih mengesankan pada koneksi yang lebih cepat.
voice_talk_vad.py
- secara otomatis mendeteksi pidato
voice_talk.py
- Rekaman beralih/mati dengan spasi
Ganti your_openai_key
dan your_elevenlabs_key
dengan nilai kunci OpenAi dan ElevenLabs API Anda dalam kode.
Instal perpustakaan Python yang diperlukan:
pip install openai elevenlabs pyaudio wave keyboard faster_whisper numpy torch
Jalankan skrip utama berdasarkan preferensi mode Anda:
python voice_talk_vad.py
atau
python voice_talk.py
voice_talk_vad.py
: Bicaralah ke mikrofon Anda.
Dengarkan jawabannya.
voice_talk.py
:Jangan ragu untuk membayar, meningkatkan, dan mengirimkan permintaan tarik. Jika Anda mempertimbangkan perubahan atau penambahan yang signifikan, silakan mulai dengan membuka masalah.
Teriakan besar untuk: