Application de traduction audio et service Web de jeux vidéo basés sur l'API ChatGPT
Une application de traduction de jeux qui utilise l'API ChatGPT pour reconnaître la parole dans le jeu (TODO : et même les visuels du jeu) et fournir des traductions de texte fluides sur des plateformes comme Switch et PS5, grâce aux puissantes capacités linguistiques de GPT.
Si vous n'avez pas encore configuré les informations d'identification locales pour votre compte AWS, vous pouvez suivre ce guide pour les configurer à l'aide de l'AWS CLI.
AWS_ACCESS_KEY_ID
et AWS_SECRET_ACCESS_KEY
et dans le profil [default]
~/.aws/credentials
. Assurez-vous également que vous disposez portaudio
, ce qui est une condition préalable à pyAudio
sudo apt install portaudio19-dev # linux
brew install portaudio # macos
Installez la dernière version de pip
pip install openai-game-translator
Installer à partir du référentiel github
git clone https://github.com/Erisae/openai-game-translator
cd openai-game-translator
make install
Pour traduire l'audio en texte dans le terminal, utilisez la commande translate
. Le moyen le plus simple d'y parvenir consiste à utiliser la transcription multimédia en temps réel d' AWS
et la traduction basée sur GPT
, comme indiqué ci-dessous :
translate --openai_key < openai_key > -i < input_language > -o < output_language > aws_live
<openai_key>
: une clé API OpenAI valide est requise pour déduire le modèle GPT à traduire.<input_language>
: Langue de l'audio à transcrire.<output_language>
: Langue cible pour la traduction.aws_live
: Cette option utilise le modèle de transcription du flux en direct AWS, permettant de télécharger le flux de données vocales sur les services AWS à l'aide du SDK AWS pendant l'enregistrement de la voix. Les autres modèles de transcription audio disponibles incluent aws_pre
et xunfei
, mais ils nécessitent des arguments supplémentaires tels que --file
, --pre_recorded
et des jetons d'API de transcription audio de xunfei.aws_live
, aws_pre
, xunfei
fonctionnent comme des sous-commandes. Assurez-vous que openai_key
, input_language
et output_language
sont attribués avant d'exécuter ces sous-commandes, sinon les valeurs des arguments pourraient ne pas être reconnues correctement. Pour plus d'informations sur l'utilisation du package en ligne de commande, reportez-vous à la documentation. Dans le script, passez simplement aws_live
pour initialiser un gameTranslator
, translator.openai_translation()
traduira l'audio chinois en texte anglais.
import openai
from game_translator import gameTranslator
openai . api_key = "<openai_key>"
translator = gameTranslator ( "aws_live" , input_language = "chinese" , output_language = "english" )
translator . openai_translation ()
translate --openai_key < openai_key > -o english -i chinese xunfei --xunfei_appid < xunfei_appid > --xunfei_apikey < xunfei_apikey > --xunfei_apisecret < xunfei_apisecret > --file audio_sample_little.wav --pre_recorded
****************************************
Transcription model : xunfei
Using prerecorded audio file : audio_sample_little.wav
Input language : chinese
Output language : english
****************************************
transcription success...
科大讯飞是中国最大的智能语音技术提供商。
translation success...
iFlytek is the largest intelligent voice technology provider in China.
Elapsed time: 3.813 seconds
translator = gameTranslator ( "aws_live" )
translator . openai_translation ()
****************************************
Transcription model : aws_live
Using prerecorded audio file : None
Input language : chinese
Output language : english
****************************************
start detecting audio...
current rms: # # |
detecting finished...
transcription success...
明天的期末考试我能考多少
translation success...
How much can I score on tomorrow ' s final exam?
Elapsed time: 9.155 seconds
Pour en savoir plus, consultez CONTRIBUTING.md