Alat CLI untuk menjalankan teks melalui teks openai ke API ucapan dan berbicara atau menyimpan hasilnya
Lihat Ospeak: Alat CLI untuk berbicara teks di terminal melalui OpenAi untuk latar belakang proyek ini.
Instal alat ini menggunakan pipx
:
pipx install ospeak
Catatan, pada macOS ada ketergantungan yang rusak dengan Python 3.12 jadi alih -alih jalankan:
pipx install --python /path/to/python3.11 ospeak
Alat ini juga tergantung pada ffmpeg
. Anda dapat menginstalnya di macOS menggunakan homebrew seperti ini:
brew install ffmpeg
Perhatikan bahwa ospeak
memiliki dependensi yang saat ini tidak kompatibel dengan LLM (lihat masalah ini) sehingga kedua alat perlu diinstal di lingkungan virtual yang berbeda, maka rekomendasi untuk menggunakan PIPX.
Untuk membuat komputer Anda mengatakan sesuatu, jalankan:
ospeak " Hello there "
Anda akan membutuhkan kunci API OpenAI. Anda dapat mengaturnya sebagai variabel lingkungan:
export OPENAI_API_KEY= " ... "
Atau Anda dapat melewatinya menggunakan --token
:
ospeak --token " ... " " Hello there "
Anda dapat menyalakan konten ke dalam alat:
echo " Hello there " | ospeak
Gunakan -v/--voice VOICE
untuk memilih suara. Standarnya adalah alloy
. Opsi lainnya adalah:
echo
fable
onyx
nova
shimmer
Anda dapat melewati -v all
untuk mendengar semua suara, masing -masing dengan nama suara yang diucapkan terlebih dahulu.
ospeak " This is my voice " -v all
Opsi -m/--model
dapat digunakan untuk memilih model yang berbeda. Standarnya adalah tts-1
. Gunakan -m tts-1-hd
untuk model kualitas lebih tinggi yang membutuhkan waktu lebih lama untuk menghasilkan audio:
ospeak " This is higher quality " -m tts-1-hd
Untuk menyesuaikan kecepatan, lulus -x/--speed
dengan nilai antara 0,25 dan 4 (defaultnya adalah 1.0):
ospeak " This is my fast voice " -x 2
Untuk menulis audio ke file, lulus -o/--output
dengan nama file berakhir di .mp3
atau .wav
:
ospeak " This is my voice " -o voice.mp3
Ini tidak akan berbicara dengan lantang. Jika Anda ingin juga berbicara, tambahkan opsi -s/--speak
:
ospeak " This is my voice " -o voice.mp3 -s
Usage: ospeak [OPTIONS] [TEXT]
CLI tool for running text through OpenAI Text to speech
Set the OPENAI_API_KEY environment variable to your OpenAI API key to avoid
using the --token option every time.
Example usage:
ospeak "Everyone deserves a pelican" --voice alloy -x 1.5
Options:
--version Show the version and exit.
-v, --voice [alloy|echo|fable|onyx|nova|shimmer|all]
Voice to use
-m, --model TEXT Model to use - defaults to tts-1
-o, --output FILE Save audio to this file on disk
-x, --speed FLOAT RANGE Speed of the voice [0.25<=x<=4.0]
-s, --speak Speak the text even when saving to a file
--token TEXT OpenAI API key
--help Show this message and exit.
Untuk berkontribusi pada alat ini, pertama -tama periksa kode. Kemudian buat lingkungan virtual baru:
cd ospeak
python -m venv venv
source venv/bin/activate
Sekarang instal dependensi dan ketergantungan tes:
pip install -e ' .[test] '
Untuk menjalankan tes:
pytest