gptspeaker
0.1
Choose OS
并选择 Raspberry Pi 操作系统(64 位)或 Ubuntu 22.04.2 LTS(64 位)。Choose Storage
,选择 SD 卡。Write
并等待映像完成。会话扬声器使用 Azure 认知服务进行语音转文本和文本转语音。以下是创建 Azure 帐户和 Azure 认知服务实例的步骤。
Try Azure for Free
。Start Free
开始创建免费的 Azure 帐户。注意:尽管这是一个免费帐户,Azure 仍然需要信用卡信息。除非您稍后更改设置,否则不会向您收费。
Cognitive Services
。在Marketplace
下选择Cognitive Services
。 (填充可能需要几秒钟。)Resource Group
下,选择Create New
。输入资源组名称(例如conv-speak-rg
)。my-conv-speak-cog-001
)。注意:建议选择美国东部、欧洲西部或东南亚,因为这些区域往往支持最多数量的功能。
Review + Create
。验证通过后,单击Create
。Go to resource
来查看 Azure 认知服务资源。Resourse Management
下,选择Keys and Endpoint
。Windows 11 用户:如果应用程序在调用文本转语音 API 时停止运行,请确保您已应用所有当前的安全更新(链接)。
对话者使用 OpenAI 的模型来进行友好的对话。以下是创建新帐户和访问人工智能模型的步骤。支持OpenAI官方API或Azure OpenAI API,任选其一。
Sign up
。注意:可以使用 Google 帐户、Microsoft 帐户或电子邮件来创建新帐户。
注意:如果您是 OpenAI 新手,请查看使用指南 (https://beta.openai.com/docs/usage-guidelines)。
View API keys
。+ Create new secret key
。复制生成的密钥并将其保存在安全位置以供以后使用。如果您想直接使用大型语言模型,请登录 https://aka.ms/maker 后查看页面顶部的 https://platform.openai.com/playground?mode=chat /openai。
选择 OpenAI 官方帐户或 Azure OpenAI 帐户
sudo apt-get update
sudo apt-get install libssl-dev libasound2
git clone https://github.com/jackwuwei/gptspeaker.git
{AzureCognitiveServices.Key}
和{AzureCognitiveServices.Region}
替换为您的 OpenAI API 密钥,并将{OpenAI.Key}
替换为您的 OpenAI API 密钥。 {
"AzureCognitiveServices" : {
"Key" : " AzureCognitiveServicesKey " ,
"Region" : " AzureCognitiveServicesRegion " ,
},
"OpenAI" : {
"Key" : " OpenAIKey " ,
},
// Just choose one of the two OpenAI above
"AzureOpenAI" :
{
"Key" : " " , // Key 1 or Key 2
"api_version" : " 2024-02-01 " ,
"Endpoint" : " " , // Endpoint
"Model" : " " // Azure AI Studio deployment name
}
}
pip3 -r install requirements.txt
python3 gptspeaker.py
代码库已经有一个默认的唤醒短语( "Hey GPT"
),我建议您首先使用它。如果您想创建自己的(免费!)自定义唤醒词,请按照以下步骤操作。
.table
文件并将其复制到源根目录。config.json
文件以在构建中包含您的唤醒短语文件。 "AzureCognitiveServices" : {
"WakePhraseModel" : " xxx.table " ,
"WakeWord" : " xxx " ,
}