gptspeaker下载 - gptspeaker源码下载

gptspeaker

Ai源码

0.1

下载

ChatGPT语音助手

ChatGPT 语音助手使用 Raspberry Pi（或桌面）来实现与 OpenAI 大语言模型的语音对话。该实现监听语音，通过 OpenAI 服务处理对话，并做出响应。比如苹果Siri、亚马逊Alex、谷歌Nest Home、米小爱同学等。
该项目是用Python编写的，支持Linux/Raspbian、macOS和Windows。

特征

支持实时语音对话。 ChatGPT 返回一句话后，您可以听到语音，而不用等待所有 ChatGPT 回复才开始语音合成。
支持连续对话，保存所有ChatGPT当前对话的历史记录。当 ChatGPT 对话大于 4096 个令牌（gpt-3.5-turbo）时，早期的对话历史记录将被丢弃。
支持本地唤醒词，像Siri一样使用。

语音助理音箱

GPT Speaker

硬件
- $ 树莓派 3/3B/4/4B
- USB 麦克风 $
- 辅助扬声器 $
- $ SD 卡（>= 8GB）（用于设置 Raspberry Pi 操作系统）
软件
- Azure 认知语音服务
  - 免费套餐：每月 5 个音频小时和 1 个并发请求。
  - 免费 200 美元积分：使用可在前 30 天内使用的新 Azure 帐户。
- 开放人工智能
  - $0.002 / 1K 代币 / ~750 个单词：ChatGPT (gpt-3.5-turbo)
  - 免费 18 美元积分：拥有可在前 90 天内使用的新 OpenAI 帐户。

设置

您将需要一个 Azure 认知服务实例和一个 OpenAI 帐户。您几乎可以在任何平台上运行该软件，但让我们从 Raspberry Pi 开始。

树莓派

如果您是 Raspberry Pi 的新手，请查看此入门指南。

1. 操作系统

将 SD 卡插入您的 PC。
访问 https://www.raspberrypi.com/software/，然后下载并运行 Raspberry Pi Imager。
单击Choose OS并选择 Raspberry Pi 操作系统（64 位）或 Ubuntu 22.04.2 LTS（64 位）。
单击Choose Storage ，选择 SD 卡。
单击Write并等待映像完成。
将 SD 卡插入 Raspberry Pi 并连接键盘、鼠标和显示器。
完成初始设置，确保配置 Wi-Fi。

2. USB 扬声器/麦克风

如果尚未插入 USB 扬声器/麦克风，请将其插入。
在 Raspberry PI OS 桌面上，右键单击屏幕右上角的音量图标，并确保选择 USB 设备。
右键单击屏幕右上角的麦克风图标，并确保选择 USB 设备。

天蓝色

会话扬声器使用 Azure 认知服务进行语音转文本和文本转语音。以下是创建 Azure 帐户和 Azure 认知服务实例的步骤。

1. Azure 帐户

在 Web 浏览器中，导航到 https://aka.ms/friendbot/azure 并单击Try Azure for Free 。
单击Start Free开始创建免费的 Azure 帐户。
使用您的 Microsoft 或 GitHub 帐户登录。
登录后，系统将提示您输入一些信息。
注意：尽管这是一个免费帐户，Azure 仍然需要信用卡信息。除非您稍后更改设置，否则不会向您收费。
帐户设置完成后，导航到 https://aka.ms/friendbot/azureportal。

2.Azure认知服务

通过 https://aka.ms/friendbot/azureportal 登录您的帐户。
在顶部的搜索栏中，输入Cognitive Services 。在Marketplace下选择Cognitive Services 。（填充可能需要几秒钟。）
验证选择了正确的订阅。在Resource Group下，选择Create New 。输入资源组名称（例如conv-speak-rg ）。
选择 Azure 认知服务实例的区域和名称（例如my-conv-speak-cog-001 ）。
注意：建议选择美国东部、欧洲西部或东南亚，因为这些区域往往支持最多数量的功能。
单击Review + Create 。验证通过后，单击Create 。
部署完成后，您可以单击“ Go to resource来查看 Azure 认知服务资源。
在左侧导航栏的Resourse Management下，选择Keys and Endpoint 。
复制两个认知服务密钥之一。将此密钥保存在安全位置以供日后使用。

Windows 11 用户：如果应用程序在调用文本转语音 API 时停止运行，请确保您已应用所有当前的安全更新（链接）。

开放人工智能

对话者使用 OpenAI 的模型来进行友好的对话。以下是创建新帐户和访问人工智能模型的步骤。支持OpenAI官方API或Azure OpenAI API，任选其一。

1.OpenAI账户

在 Web 浏览器中，导航到 https://aka.ms/maker/openai。单击Sign up 。
注意：可以使用 Google 帐户、Microsoft 帐户或电子邮件来创建新帐户。
完成注册过程（例如，创建密码、验证您的电子邮件等）。
注意：如果您是 OpenAI 新手，请查看使用指南 (https://beta.openai.com/docs/usage-guidelines)。
在右上角单击您的帐户。单击View API keys 。
单击+ Create new secret key 。复制生成的密钥并将其保存在安全位置以供以后使用。

如果您想直接使用大型语言模型，请登录 https://aka.ms/maker 后查看页面顶部的 https://platform.openai.com/playground?mode=chat /openai。

2. Azure OpenAI 帐户

选择 OpenAI 官方帐户或 Azure OpenAI 帐户

创建 Azure 帐户
- 如果您没有Azure帐户，请前往Azure官网注册帐户。 Azure提供免费帐户选项，新用户可以获得一定数量的免费积分用于测试和学习。
申请访问
- 在Azure OpenAI服务页面，单击“申请访问”按钮。这将带您进入申请页面，您需要填写一些必要的信息，包括您的公司名称、用例等。
配置与使用
- 获得访问权限后，可以在 Azure 门户中创建新的 OpenAI 服务资源。创建完成后，您可以按照官方文档获取API密钥并开始使用Azure OpenAI服务。

守则

1. 代码配置

Python 语音 SDK 包适用于 Windows（x64 和 x86）、Mac x64（macOS X 版本 10.14 或更高版本）、Mac arm64（macOS 版本 11.0 或更高版本）和 Linux
在 Raspberry Pi 或您的 PC 上，打开命令行终端。
在 Ubuntu 或 Debian 上，运行以下命令来安装所需的软件包：
```
sudo apt-get update
sudo apt-get install libssl-dev libasound2
```
在Ubuntu 22.04 LTS上，还需要从 http://security.ubuntu.com/ubuntu/pool/main/o/openssl/ 下载并安装最新的libssl1.1软件包。

克隆存储库。

git clone https://github.com/jackwuwei/gptspeaker.git

设置 API 密钥：将 config.json {AzureCognitiveServices.Key}和{AzureCognitiveServices.Region}替换为您的 OpenAI API 密钥，并将{OpenAI.Key}替换为您的 OpenAI API 密钥。

{
     "AzureCognitiveServices" : {
        "Key" : " AzureCognitiveServicesKey " , 
        "Region" : " AzureCognitiveServicesRegion " ,
    },

    "OpenAI" : {
        "Key" : " OpenAIKey " , 
    },

    // Just choose one of the two OpenAI above
     "AzureOpenAI" : 
     {
        "Key" : " " , // Key 1 or Key 2
        "api_version" : " 2024-02-01 " ,
        "Endpoint" : " " , // Endpoint
        "Model" : " " // Azure AI Studio deployment name 
  }
}

安装要求
```
pip3 -r install requirements.txt
```
运行代码
```
python3 gptspeaker.py
```

2.（可选）创建自定义唤醒短语

代码库已经有一个默认的唤醒短语（ "Hey GPT" ），我建议您首先使用它。如果您想创建自己的（免费！）自定义唤醒词，请按照以下步骤操作。

使用此处的说明创建自定义关键字模型：https://aka.ms/hackster/microsoft/wakeword。
下载模型，解压.table文件并将其复制到源根目录。

更新config.json文件以在构建中包含您的唤醒短语文件。

 "AzureCognitiveServices" : {
   "WakePhraseModel" : " xxx.table " ,
   "WakeWord" : " xxx " ,
}

重建并运行项目以使用您的自定义唤醒词。

展开

附加信息

版本 0.1
类型 Ai源码
更新时间 2024-12-19
大小 10.96MB
来自于 Github

gptspeaker

ChatGPT语音助手

特征

语音助理音箱

设置

树莓派

1. 操作系统

2. USB 扬声器/麦克风

天蓝色

1. Azure 帐户

2.Azure认知服务

开放人工智能

1.OpenAI账户

2. Azure OpenAI 帐户

守则

1. 代码配置

2.（可选）创建自定义唤醒短语

node telegram bot api

typebot.io

python wechaty getting started

TranscriberBot

genal chat

Facemoji

chat.petals.dev

GPT Prompt Templates

GPTyped

node telegram bot api

typebot.io

python wechaty getting started

waymo open dataset

termwind

wp functions