AudioGPT
1.0.0
우리는 이 저장소에서 구현 및 사전 훈련된 모델을 오픈 소스로 제공합니다.
run.md를 참고해주세요
여기에는 현재 AudioGPT의 기능이 나열되어 있습니다. 더 많은 지원 모델과 작업이 곧 제공될 예정입니다. 프롬프트 예시는 자산을 참조하세요.
현재 모든 모델에 저장소가 있는 것은 아닙니다.
일 | 지원되는 기초 모델 | 상태 |
---|---|---|
텍스트 음성 변환 | FastSpeech, SyntaSpeech, VITS | 예(WIP) |
스타일 트랜스퍼 | GenerSpeech | 예 |
음성 인식 | 속삭임, 순응자 | 예 |
음성 향상 | ConvTasNet | 예(WIP) |
음성 분리 | TF-그리드넷 | 예(WIP) |
음성 번역 | 멀티 디코더 | WIP |
모노-바이노럴 | 신경 워프 | 예 |
일 | 지원되는 기초 모델 | 상태 |
---|---|---|
텍스트를 노래로 변환 | DiffSinger, VISinger | 예(WIP) |
일 | 지원되는 기초 모델 | 상태 |
---|---|---|
텍스트-오디오 | 오디오 만들기 | 예 |
오디오 인페인팅 | 오디오 만들기 | 예 |
이미지-오디오 | 오디오 만들기 | 예 |
소리 감지 | 오디오 변압기 | 예 |
타겟 사운드 감지 | TSDNet | 예 |
소리 추출 | 라스넷 | 예 |
일 | 지원되는 기초 모델 | 상태 |
---|---|---|
말하는 머리 합성 | 진페이스 | 예(WIP) |
우리는 다음 프로젝트의 오픈 소스에 감사드립니다.
ESPNet NAT음성 비주얼 채팅GPT 포옹 얼굴 LangChain Stable Diffusion