นี่คือเซิร์ฟเวอร์ที่ใช้ FastAPI ซึ่งทำหน้าที่เป็นอินเทอร์เฟซระหว่างแอปพลิเคชันของคุณกับบริการ AI บนคลาวด์ มุ่งเน้นไปที่งานหลักสามประการ:
ปัจจุบันใช้ API ของ OpenAI สำหรับบริการเหล่านี้ แต่ได้รับการออกแบบมาเพื่อให้เราสามารถเพิ่มผู้ให้บริการรายอื่นได้ในอนาคต
การถอดเสียง (คำพูดเป็นข้อความ)
ข้อความเป็นคำพูด
คำพูดเป็นคำพูด
.
├── cloud_providers/
│ ├── base.py
│ └── openai_api_handler.py
├── server/
│ ├── main.py
│ ├── routers/
│ │ ├── transcribe.py
│ │ ├── tts.py
│ │ └── speech_to_speech.py
│ └── utils/
│ └── logger.py
|
└── requirements.txt
└── README.md
โคลนพื้นที่เก็บข้อมูล
สร้างสภาพแวดล้อมเสมือนจริง:
python -m venv venv
source venv/bin/activate
ติดตั้งการพึ่งพา:
pip install -r requirements
ตั้งค่าตัวแปรสภาพแวดล้อม:
export OPENAI_API_KEY=your_openai_api_key
ในการเริ่มต้นเซิร์ฟเวอร์ ให้นำทางไปยังไดเร็กทอรีโปรเจ็กต์แล้วรัน:
python server/main.py
สิ่งนี้จะเริ่มต้นเซิร์ฟเวอร์ FastAPI ซึ่งโดยทั่วไปจะอยู่บน http://localhost:8000
API docs
แอปพลิเคชันใช้ตัวจัดการไฟล์แบบหมุนสำหรับการบันทึก โดยมีไฟล์บันทึกแยกต่างหากสำหรับส่วนประกอบต่างๆ:
logs/main.log
: บันทึกแอปพลิเคชันหลักlogs/transcription.log
: บันทึกเฉพาะการถอดเสียงlogs/tts.log
: บันทึกการอ่านออกเสียงข้อความlogs/speech_to_speech.log
: บันทึกคำพูดเป็นคำพูด แอปพลิเคชันประกอบด้วยการจัดการข้อผิดพลาดสำหรับสถานการณ์ต่างๆ รวมถึงข้อผิดพลาด API และการตัดการเชื่อมต่อของ WebSocket บันทึกข้อผิดพลาดและเกิดข้อยกเว้น HTTP ที่เหมาะสม
โครงการนี้ได้รับการออกแบบโดยคำนึงถึงความสามารถในการขยายได้ คลาสฐานนามธรรม CloudProviderBase
ใน base.py
ช่วยให้สามารถผสานรวมผู้ให้บริการคลาวด์เพิ่มเติมนอกเหนือจาก OpenAI ได้อย่างง่ายดาย
ยินดีบริจาค! โปรดส่งคำขอดึง
[ระบุใบอนุญาตของคุณที่นี่]