gptspeaker
0.1
Choose OS
並選擇 Raspberry Pi 作業系統(64 位元)或 Ubuntu 22.04.2 LTS(64 位元)。Choose Storage
,選擇 SD 卡。Write
並等待映像完成。會話揚聲器使用 Azure 認知服務進行語音轉文字和文字轉語音。以下是建立 Azure 帳戶和 Azure 認知服務執行個體的步驟。
Try Azure for Free
。Start Free
開始建立免費的 Azure 帳戶。注意:儘管這是一個免費帳戶,Azure 仍然需要信用卡資訊。除非您稍後更改設置,否則不會向您收費。
Cognitive Services
。在Marketplace
下選擇Cognitive Services
。 (填充可能需要幾秒鐘。)Resource Group
下,選擇Create New
。輸入資源組名稱(例如conv-speak-rg
)。my-conv-speak-cog-001
)。注意:建議使用美國東部、歐洲西部或東南亞,因為這些區域往往支援最多數量的功能。
Review + Create
。驗證通過後,按一下Create
。Go to resource
以查看 Azure 認知服務資源。Resourse Management
下,選擇Keys and Endpoint
。Windows 11 使用者:如果應用程式在呼叫文字轉語音 API 時停止執行,請確保您已套用所有目前的安全性更新(連結)。
對話者使用 OpenAI 的模型來進行友善的對話。以下是建立新帳戶和存取人工智慧模型的步驟。支援OpenAI官方API或Azure OpenAI API,任選其一。
Sign up
。注意:可以使用 Google 帳戶、Microsoft 帳戶或電子郵件建立新帳戶。
注意:如果您是 OpenAI 新手,請查看使用指南 (https://beta.openai.com/docs/usage-guidelines)。
View API keys
。+ Create new secret key
。複製產生的金鑰並將其保存在安全位置以供以後使用。如果您想直接使用大型語言模型,請登入 https://aka.ms/maker 後查看頁面頂部的 https://platform.openai.com/playground?mode=chat /openai。
選擇 OpenAI 官方帳戶或 Azure OpenAI 帳戶
sudo apt-get update
sudo apt-get install libssl-dev libasound2
git clone https://github.com/jackwuwei/gptspeaker.git
{AzureCognitiveServices.Key}
和{AzureCognitiveServices.Region}
替換為您的 OpenAI API 金鑰,並將{OpenAI.Key}
取代為您的 OpenAI API 金鑰。 {
"AzureCognitiveServices" : {
"Key" : " AzureCognitiveServicesKey " ,
"Region" : " AzureCognitiveServicesRegion " ,
},
"OpenAI" : {
"Key" : " OpenAIKey " ,
},
// Just choose one of the two OpenAI above
"AzureOpenAI" :
{
"Key" : " " , // Key 1 or Key 2
"api_version" : " 2024-02-01 " ,
"Endpoint" : " " , // Endpoint
"Model" : " " // Azure AI Studio deployment name
}
}
pip3 -r install requirements.txt
python3 gptspeaker.py
程式碼庫已經有一個預設的喚醒短語( "Hey GPT"
),我建議您先使用它。如果您想創建自己的(免費!)自訂喚醒詞,請按照以下步驟操作。
.table
檔案並將其複製到來源根目錄。config.json
檔案以在建置中包含您的喚醒短語檔案。 "AzureCognitiveServices" : {
"WakePhraseModel" : " xxx.table " ,
"WakeWord" : " xxx " ,
}