ASRInferenceEngine
1.0.0
이는 애플리케이션과 클라우드 기반 AI 서비스 간의 인터페이스 역할을 하는 FastAPI 기반 서버입니다. 이는 세 가지 주요 작업에 중점을 둡니다.
현재는 이러한 서비스에 OpenAI의 API를 사용하지만 향후 다른 공급자를 추가할 수 있도록 설계되었습니다.
전사(음성-텍스트)
텍스트 음성 변환
음성 대 음성
.
├── cloud_providers/
│ ├── base.py
│ └── openai_api_handler.py
├── server/
│ ├── main.py
│ ├── routers/
│ │ ├── transcribe.py
│ │ ├── tts.py
│ │ └── speech_to_speech.py
│ └── utils/
│ └── logger.py
|
└── requirements.txt
└── README.md
저장소 복제
가상 환경을 생성합니다:
python -m venv venv
source venv/bin/activate
종속성을 설치합니다.
pip install -r requirements
환경 변수를 설정합니다.
export OPENAI_API_KEY=your_openai_api_key
서버를 시작하려면 프로젝트 디렉터리로 이동하여 다음을 실행합니다.
python server/main.py
그러면 일반적으로 http://localhost:8000
에서 FastAPI 서버가 시작됩니다.
API docs
에 대한 자세한 내용은 애플리케이션은 다양한 구성 요소에 대한 별도의 로그 파일과 함께 로깅을 위해 회전 파일 처리기를 사용합니다.
logs/main.log
: 기본 애플리케이션 로그logs/transcription.log
: 전사 관련 로그logs/tts.log
: 텍스트 음성 변환 로그logs/speech_to_speech.log
: 음성 대 음성 로그 애플리케이션에는 API 오류 및 WebSocket 연결 끊김을 포함한 다양한 시나리오에 대한 오류 처리가 포함되어 있습니다. 오류가 기록되고 적절한 HTTP 예외가 발생합니다.
이 프로젝트는 확장성을 염두에 두고 설계되었습니다. base.py
의 CloudProviderBase
추상 기본 클래스를 사용하면 OpenAI 이외의 추가 클라우드 공급자를 쉽게 통합할 수 있습니다.
기여를 환영합니다! 언제든지 Pull Request를 제출해 주세요.
[여기서 라이센스를 지정하세요]