ASRInferenceEngine
1.0.0
這是一個基於 FastAPI 的伺服器,可作為應用程式和基於雲端的 AI 服務之間的介面。它側重於三個主要任務:
目前,它使用 OpenAI 的 API 來提供這些服務,但它的設計是為了讓我們將來可以添加其他提供者。
轉錄(語音轉文字)
文字轉語音
語音對語音
.
├── cloud_providers/
│ ├── base.py
│ └── openai_api_handler.py
├── server/
│ ├── main.py
│ ├── routers/
│ │ ├── transcribe.py
│ │ ├── tts.py
│ │ └── speech_to_speech.py
│ └── utils/
│ └── logger.py
|
└── requirements.txt
└── README.md
克隆儲存庫
建立虛擬環境:
python -m venv venv
source venv/bin/activate
安裝依賴項:
pip install -r requirements
設定環境變數:
export OPENAI_API_KEY=your_openai_api_key
要啟動伺服器,請導航至專案目錄並運行:
python server/main.py
這將啟動 FastAPI 伺服器,通常位於http://localhost:8000
。
API docs
該應用程式使用旋轉文件處理程序進行日誌記錄,並為不同的組件提供單獨的日誌檔案:
logs/main.log
: 主應用程式日誌logs/transcription.log
:特定於轉錄的日誌logs/tts.log
:文字轉語音日誌logs/speech_to_speech.log
:語音轉語音日誌該應用程式包括針對各種場景的錯誤處理,包括 API 錯誤和 WebSocket 斷開連接。記錄錯誤並引發適當的 HTTP 異常。
該項目的設計考慮到了可擴展性。 base.py
中的CloudProviderBase
抽象基底類別允許輕鬆整合 OpenAI 以外的其他雲端提供者。
歡迎貢獻!請隨時提交 Pull 請求。
[在此指定您的許可證]