Aplicativo tradutor de áudio de videogame baseado em API ChatGPT e serviço da web
Um aplicativo de tradução de jogos que usa a API ChatGPT para reconhecer a fala do jogo (TODO: e até mesmo recursos visuais do jogo) e fornecer traduções de texto suaves em plataformas como Switch e PS5, graças às poderosas habilidades de linguagem do GPT.
Se ainda não tiver as credenciais locais configuradas para sua conta da AWS, você pode seguir este guia para configurá-las usando a AWS CLI.
AWS_ACCESS_KEY_ID
e AWS_SECRET_ACCESS_KEY
e no perfil [default]
~/.aws/credentials
. Além disso, certifique-se de ter portaudio
, que é um pré-requisito para pyAudio
sudo apt install portaudio19-dev # linux
brew install portaudio # macos
Instale a versão mais recente do pip
pip install openai-game-translator
Instalar a partir do repositório github
git clone https://github.com/Erisae/openai-game-translator
cd openai-game-translator
make install
Para traduzir áudio em texto no terminal, use o comando translate
. A maneira mais simples de conseguir isso é por meio da transcrição de mídia em tempo real da AWS
e da tradução baseada em GPT
, conforme mostrado abaixo:
translate --openai_key < openai_key > -i < input_language > -o < output_language > aws_live
<openai_key>
: uma chave de API OpenAI válida é necessária para inferir o modelo GPT a ser traduzido.<input_language>
: Idioma do áudio a ser transcrito.<output_language>
: Idioma alvo da tradução.aws_live
: esta opção usa o modelo de transcrição de transmissão ao vivo da AWS, permitindo que o fluxo de dados de voz seja carregado nos serviços da AWS usando o SDK da AWS durante a gravação da voz. Outros modelos de transcrição de áudio disponíveis incluem aws_pre
e xunfei
, mas exigem argumentos adicionais, como --file
, --pre_recorded
e tokens de API de transcrição de áudio de xunfei.aws_live
, aws_pre
, xunfei
funcionam como subcomandos. Certifique-se de que openai_key
, input_language
e output_language
estejam atribuídos antes de executar esses subcomandos, caso contrário, os valores dos argumentos poderão não ser reconhecidos corretamente. Para obter mais informações sobre como usar o pacote na linha de comando, consulte a documentação. No script, basta passar aws_live
para inicializar um gameTranslator
, translator.openai_translation()
traduzirá o áudio chinês para texto em inglês.
import openai
from game_translator import gameTranslator
openai . api_key = "<openai_key>"
translator = gameTranslator ( "aws_live" , input_language = "chinese" , output_language = "english" )
translator . openai_translation ()
translate --openai_key < openai_key > -o english -i chinese xunfei --xunfei_appid < xunfei_appid > --xunfei_apikey < xunfei_apikey > --xunfei_apisecret < xunfei_apisecret > --file audio_sample_little.wav --pre_recorded
****************************************
Transcription model : xunfei
Using prerecorded audio file : audio_sample_little.wav
Input language : chinese
Output language : english
****************************************
transcription success...
科大讯飞是中国最大的智能语音技术提供商。
translation success...
iFlytek is the largest intelligent voice technology provider in China.
Elapsed time: 3.813 seconds
translator = gameTranslator ( "aws_live" )
translator . openai_translation ()
****************************************
Transcription model : aws_live
Using prerecorded audio file : None
Input language : chinese
Output language : english
****************************************
start detecting audio...
current rms: # # |
detecting finished...
transcription success...
明天的期末考试我能考多少
translation success...
How much can I score on tomorrow ' s final exam?
Elapsed time: 9.155 seconds
Veja mais em CONTRIBUTING.md