ASRInferenceEngine
1.0.0
这是一个基于 FastAPI 的服务器,充当应用程序和基于云的 AI 服务之间的接口。它侧重于三个主要任务:
目前,它使用 OpenAI 的 API 来提供这些服务,但它的设计是为了让我们将来可以添加其他提供商。
转录(语音转文本)
文字转语音
语音对语音
.
├── cloud_providers/
│ ├── base.py
│ └── openai_api_handler.py
├── server/
│ ├── main.py
│ ├── routers/
│ │ ├── transcribe.py
│ │ ├── tts.py
│ │ └── speech_to_speech.py
│ └── utils/
│ └── logger.py
|
└── requirements.txt
└── README.md
克隆存储库
创建虚拟环境:
python -m venv venv
source venv/bin/activate
安装依赖项:
pip install -r requirements
设置环境变量:
export OPENAI_API_KEY=your_openai_api_key
要启动服务器,请导航到项目目录并运行:
python server/main.py
这将启动 FastAPI 服务器,通常位于http://localhost:8000
。
API docs
该应用程序使用旋转文件处理程序进行日志记录,并为不同的组件提供单独的日志文件:
logs/main.log
: 主应用程序日志logs/transcription.log
:特定于转录的日志logs/tts.log
:文本转语音日志logs/speech_to_speech.log
:语音转语音日志该应用程序包括针对各种场景的错误处理,包括 API 错误和 WebSocket 断开连接。记录错误并引发适当的 HTTP 异常。
该项目的设计考虑到了可扩展性。 base.py
中的CloudProviderBase
抽象基类允许轻松集成 OpenAI 之外的其他云提供商。
欢迎贡献!请随时提交 Pull 请求。
[在此处指定您的许可证]