openai game translator
v1.3.0 release
ChatGPT API ベースのビデオ ゲーム オーディオ トランスレーター アプリケーションおよび Web サービス
ChatGPT API を使用してゲーム内の音声 (TODO: およびゲームのビジュアルも) を認識し、GPT の強力な言語機能のおかげで、Switch や PS5 などのプラットフォームでスムーズなテキスト翻訳を提供するゲーム翻訳アプリです。
AWS アカウントのローカル認証情報をまだ設定していない場合は、このガイドに従って AWS CLI を使用して認証情報を設定できます。
AWS_ACCESS_KEY_ID
およびAWS_SECRET_ACCESS_KEY
環境変数と[default]
プロファイル~/.aws/credentials
を設定する必要があります。また、 pyAudio
の前提条件であるportaudio
があることを確認してください。
sudo apt install portaudio19-dev # linux
brew install portaudio # macos
pipから最新バージョンをインストールします
pip install openai-game-translator
githubリポジトリからインストール
git clone https://github.com/Erisae/openai-game-translator
cd openai-game-translator
make install
ターミナルで音声をテキストに翻訳するには、 translate
コマンドを使用します。これを実現する最も簡単な方法は、以下に示すように、 AWS
のリアルタイム メディア トランスクリプションとGPT
ベースの翻訳を使用することです。
translate --openai_key < openai_key > -i < input_language > -o < output_language > aws_live
<openai_key>
: GPT モデルを推論して変換するには、有効な OpenAI API キーが必要です。<input_language>
: 文字起こしされる音声の言語。<output_language>
: 翻訳のターゲット言語。aws_live
: このオプションは AWS ライブ ストリーム転写モデルを使用し、音声を録音しながら AWS SDK を使用して音声データ ストリームを AWS サービスにアップロードできるようにします。その他の利用可能なオーディオ トランスクリプション モデルには、 aws_pre
およびxunfei
が含まれますが、 --file
、 --pre_recorded
などの追加の引数、および xunfei からのオーディオ トランスクリプション API トークンが必要です。aws_live
、 aws_pre
、 xunfei
サブコマンドとして機能することに注意してください。これらのサブコマンドを実行する前に、 openai_key
、 input_language
、およびoutput_language
が割り当てられていることを確認してください。割り当てられていないと、引数値が正しく認識されない可能性があります。コマンドラインでパッケージを使用する方法の詳細については、ドキュメントを参照してください。スクリプトでaws_live
を渡すだけでgameTranslator
を初期化できます。translator.openai_translation translator.openai_translation()
中国語の音声を英語のテキストに翻訳します。
import openai
from game_translator import gameTranslator
openai . api_key = "<openai_key>"
translator = gameTranslator ( "aws_live" , input_language = "chinese" , output_language = "english" )
translator . openai_translation ()
translate --openai_key < openai_key > -o english -i chinese xunfei --xunfei_appid < xunfei_appid > --xunfei_apikey < xunfei_apikey > --xunfei_apisecret < xunfei_apisecret > --file audio_sample_little.wav --pre_recorded
****************************************
Transcription model : xunfei
Using prerecorded audio file : audio_sample_little.wav
Input language : chinese
Output language : english
****************************************
transcription success...
科大讯飞是中国最大的智能语音技术提供商。
translation success...
iFlytek is the largest intelligent voice technology provider in China.
Elapsed time: 3.813 seconds
translator = gameTranslator ( "aws_live" )
translator . openai_translation ()
****************************************
Transcription model : aws_live
Using prerecorded audio file : None
Input language : chinese
Output language : english
****************************************
start detecting audio...
current rms: # # |
detecting finished...
transcription success...
明天的期末考试我能考多少
translation success...
How much can I score on tomorrow ' s final exam?
Elapsed time: 9.155 seconds
詳細については、CONTRIBUTING.md をご覧ください。