ดาวน์โหลด AudioGPT - ดาวน์โหลดซอร์สโค้ด AudioGPT

ดาวน์โหลด

AudioGPT: การทำความเข้าใจและสร้างคำพูด ดนตรี เสียง และหัวพูดคุย

เราจัดเตรียมการนำไปใช้งานและโมเดลที่ได้รับการฝึกอบรมไว้ล่วงหน้าเป็นโอเพ่นซอร์สในพื้นที่เก็บข้อมูลนี้

โปรดดูที่ run.md

ที่นี่เราจะแสดงรายการความสามารถของ AudioGPT ในขณะนี้ โมเดลและงานที่รองรับเพิ่มเติมจะมาในเร็วๆ นี้ สำหรับตัวอย่างที่ชัดเจน โปรดดูที่เนื้อหา

ปัจจุบันไม่ใช่ทุกรุ่นที่มีพื้นที่เก็บข้อมูล

งาน	แบบจำลองมูลนิธิที่รองรับ	สถานะ
ข้อความเป็นคำพูด	FastSpeech, SyntaSpeech, VITS	ใช่ (ระหว่างดำเนินการ)
การถ่ายโอนสไตล์	GenerSpeech	ใช่
การรู้จำเสียง	กระซิบ Conformer	ใช่
การเพิ่มประสิทธิภาพคำพูด	ConvTasNet	ใช่ (ระหว่างดำเนินการ)
การแยกคำพูด	TF-GridNet	ใช่ (ระหว่างดำเนินการ)
การแปลคำพูด	มัลติถอดรหัส	วีไอพี
Mono-to-Binaural	NeuralWarp	ใช่

งาน	แบบจำลองมูลนิธิที่รองรับ	สถานะ
ข้อความเป็นร้องเพลง	ดิฟซิงเกอร์, วิสซิงเกอร์	ใช่ (ระหว่างดำเนินการ)