การรู้จำเสียง | การสังเคราะห์เสียงพูด |
---|---|
บัตรประจำตัวของผู้พูด | การถอดเสียงของผู้พูด | การตรวจสอบวิทยากร |
---|---|---|
การระบุภาษาพูด | การแท็กเสียง | การตรวจจับกิจกรรมเสียง |
---|---|---|
การจำแนกคำหลัก | เพิ่มเครื่องหมายวรรคตอน |
---|---|
สถาปัตยกรรม | หุ่นยนต์ | ไอโอเอส | หน้าต่าง | ระบบปฏิบัติการ macOS | ลินุกซ์ | HarmonyOS |
---|---|---|---|---|---|---|
x64 | ||||||
x86 | ||||||
อาร์ม64 | ||||||
แขน32 | ||||||
riscv64 |
1. ซี++ | 2. ซี | 3. หลาม | 4. จาวาสคริปต์ |
---|---|---|---|
5. ชวา | 6. ซี# | 7. คอตลิน | 8. สวิฟท์ |
---|---|---|---|
9. ไป | 10. โผ | 11. สนิม | 12. ปาสคาล |
---|---|---|---|
สำหรับการสนับสนุนของ Rust โปรดดูที่ sherpa-rs
นอกจากนี้ยังรองรับ WebAssembly
พื้นที่เก็บข้อมูลนี้รองรับการเรียกใช้ฟังก์ชันต่อไปนี้ ในเครื่อง
บนแพลตฟอร์มและระบบปฏิบัติการดังต่อไปนี้:
x86_64
, ARM 32 บิต, ARM 64 บิต (arm64, aarch64), RISC-V (riscv64)ด้วย API ต่อไปนี้
C#
คำอธิบาย | URL |
---|---|
การถอดเสียงของผู้พูด | คลิกฉัน |
การรู้จำเสียง | คลิกฉัน |
การรู้จำเสียงด้วย Whisper | คลิกฉัน |
การสังเคราะห์เสียงพูด | คลิกฉัน |
สร้างคำบรรยาย | คลิกฉัน |
การแท็กเสียง | คลิกฉัน |
การระบุภาษาพูดด้วย Whisper | คลิกฉัน |
เรายังมีพื้นที่ที่สร้างขึ้นโดยใช้ WebAssembly พวกเขาอยู่ด้านล่าง:
คำอธิบาย | พื้นที่กอดหน้า | พื้นที่โมเดลสโคป |
---|---|---|
การตรวจจับกิจกรรมเสียงด้วย silero-vad | คลิกฉัน | 地址 |
การรู้จำเสียงพูดแบบเรียลไทม์ (จีน + อังกฤษ) ด้วย Zipformer | คลิกฉัน | 地址 |
การรู้จำเสียงพูดแบบเรียลไทม์ (จีน + อังกฤษ) ด้วย Paraformer | คลิกฉัน | 地址 |
การรู้จำเสียงพูดแบบเรียลไทม์ (จีน + อังกฤษ + กวางตุ้ง) พร้อม Paraformer-large | คลิกฉัน | 地址 |
การรู้จำเสียงพูดแบบเรียลไทม์ (อังกฤษ) | คลิกฉัน | 地址 |
VAD + การรู้จำคำพูด (จีน + อังกฤษ + เกาหลี + ญี่ปุ่น + กวางตุ้ง) ด้วย SenseVoice | คลิกฉัน | 地址 |
VAD + การรู้จำคำพูด (อังกฤษ) พร้อม Whisper Tiny.en | คลิกฉัน | 地址 |
VAD + การรู้จำคำพูด (ภาษาอังกฤษ) พร้อม Moonshine Tiny | คลิกฉัน | 地址 |
VAD + การรู้จำคำพูด (ภาษาอังกฤษ) พร้อม Zipformer ที่ผ่านการฝึกอบรมด้วย GigaSpeech | คลิกฉัน | 地址 |
VAD + การรู้จำคำพูด (ภาษาจีน) ด้วย Zipformer ที่ผ่านการฝึกอบรมด้วย WenetSpeech | คลิกฉัน | 地址 |
VAD + การรู้จำคำพูด (ภาษาญี่ปุ่น) ด้วย Zipformer ที่ผ่านการฝึกอบรมด้วย ReazonSpeech | คลิกฉัน | 地址 |
VAD + การรู้จำคำพูด (ภาษาไทย) ด้วย Zipformer ที่ได้รับการฝึกด้วย GigaSpeech2 | คลิกฉัน | 地址 |
VAD + การรู้จำคำพูด (ภาษาจีน 多种方言) ด้วยโมเดล TeleSpeech-ASR CTC | คลิกฉัน | 地址 |
VAD + การรู้จำคำพูด (อังกฤษ + จีน 及多种中文方言) พร้อม Paraformer-large | คลิกฉัน | 地址 |
VAD + การรู้จำคำพูด (อังกฤษ + จีน 及多种中文方言) พร้อม Paraformer-small | คลิกฉัน | 地址 |
การสังเคราะห์เสียงพูด (อังกฤษ) | คลิกฉัน | 地址 |
การสังเคราะห์เสียงพูด (ภาษาเยอรมัน) | คลิกฉัน | 地址 |
การถอดเสียงของผู้พูด | คลิกฉัน | 地址 |
คำอธิบาย | URL | 中国用户 |
---|---|---|
การถอดเสียงของผู้พูด | ที่อยู่ | 点此 |
การรู้จำคำพูดแบบสตรีมมิ่ง | ที่อยู่ | 点此 |
ข้อความเป็นคำพูด | ที่อยู่ | 点此 |
การตรวจจับกิจกรรมเสียง (VAD) | ที่อยู่ | 点此 |
VAD + การรู้จำคำพูดแบบไม่สตรีมมิ่ง | ที่อยู่ | 点此 |
การรู้จำเสียงพูดสองรอบ | ที่อยู่ | 点此 |
การแท็กเสียง | ที่อยู่ | 点此 |
การแท็กเสียง (WearOS) | ที่อยู่ | 点此 |
บัตรประจำตัวของผู้พูด | ที่อยู่ | 点此 |
การระบุภาษาพูด | ที่อยู่ | 点此 |
การจำแนกคำหลัก | ที่อยู่ | 点此 |
คำอธิบาย | URL | 中国用户 |
---|---|---|
การรู้จำคำพูดแบบสตรีมมิ่ง | ที่อยู่ | 点此 |
คำอธิบาย | URL | 中国用户 |
---|---|---|
ระบบปฏิบัติการ Android (arm64-v8a, armeabi-v7a, x86_64) | ที่อยู่ | 点此 |
ลินุกซ์ (x64) | ที่อยู่ | 点此 |
macOS (x64) | ที่อยู่ | 点此 |
macOS (arm64) | ที่อยู่ | 点此 |
หน้าต่าง (x64) | ที่อยู่ | 点此 |
หมายเหตุ: คุณต้องสร้างจากแหล่งที่มาสำหรับ iOS
คำอธิบาย | URL | 中国用户 |
---|---|---|
สร้างคำบรรยาย (生成字幕) | ที่อยู่ | 点此 |
คำอธิบาย | URL |
---|---|
การรู้จำเสียง (คำพูดเป็นข้อความ, ASR) | ที่อยู่ |
การอ่านออกเสียงข้อความ (TTS) | ที่อยู่ |
ภาษีมูลค่าเพิ่ม | ที่อยู่ |
การจำแนกคำหลัก | ที่อยู่ |
การแท็กเสียง | ที่อยู่ |
การระบุผู้พูด (Speaker ID) | ที่อยู่ |
การระบุภาษาพูด (รหัสภาษา) | ดูรุ่น Whisper ASR หลายภาษาจากการรู้จำเสียง |
เครื่องหมายวรรคตอน | ที่อยู่ |
การแบ่งส่วนผู้พูด | ที่อยู่ |
โปรดดู
สำหรับรุ่นอื่นๆ ตารางต่อไปนี้แสดงรายการเพียง บาง ส่วนเท่านั้น
ชื่อ | ภาษาที่รองรับ | คำอธิบาย |
---|---|---|
sherpa-onnx-สตรีมมิ่ง-zipformer-สองภาษา-zh-en-2023-02-20 | จีนอังกฤษ | ดูเพิ่มเติม |
sherpa-onnx-สตรีมมิ่ง-zipformer-ขนาดเล็ก-สองภาษา-zh-en-2023-02-16 | จีนอังกฤษ | ดูเพิ่มเติม |
sherpa-onnx-สตรีมมิ่ง-zipformer-zh-14M-2023-02-23 | ชาวจีน | เหมาะสำหรับซีพียู Cortex A7 ดูเพิ่มเติม |
sherpa-onnx-สตรีมมิ่ง-zipformer-en-20M-2023-02-17 | ภาษาอังกฤษ | เหมาะสำหรับซีพียู Cortex A7 ดูเพิ่มเติม |
sherpa-onnx-สตรีมมิ่ง-zipformer-เกาหลี-2024-06-16 | เกาหลี | ดูเพิ่มเติม |
sherpa-onnx-สตรีมมิ่ง-zipformer-fr-2023-04-14 | ภาษาฝรั่งเศส | ดูเพิ่มเติม |
โปรดดู
สำหรับรุ่นอื่นๆ ตารางต่อไปนี้แสดงรายการเพียง บาง ส่วนเท่านั้น
ชื่อ | ภาษาที่รองรับ | คำอธิบาย |
---|---|---|
กระซิบ Tiny.en | ภาษาอังกฤษ | ดูเพิ่มเติม |
แสงจันทร์ เล็กๆ | ภาษาอังกฤษ | ดูเพิ่มเติม |
sherpa-onnx-sense-เสียง-zh-en-ja-ko-yue-2024-07-17 | จีนกวางตุ้งอังกฤษเกาหลีญี่ปุ่น | 支持多种中文方言. ดูเพิ่มเติม |
เชอร์ปา-onnx-paraformer-zh-2024-03-09 | จีนอังกฤษ | 也支持多种中文方言. ดูเพิ่มเติม |
sherpa-onnx-zipformer-ja-reazonspeech-2024-08-01 | ญี่ปุ่น | ดูเพิ่มเติม |
sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24 | ภาษารัสเซีย | ดูเพิ่มเติม |
sherpa-onnx-nemo-ctc-giga-am-russian-2024-10-24 | ภาษารัสเซีย | ดูเพิ่มเติม |
sherpa-onnx-zipformer-ru-2024-09-18 | ภาษารัสเซีย | ดูเพิ่มเติม |
sherpa-onnx-zipformer-เกาหลี-2024-06-24 | เกาหลี | ดูเพิ่มเติม |
sherpa-onnx-zipformer-thai-2024-06-20 | แบบไทย | ดูเพิ่มเติม |
เชอร์ปา-onnx-telespeech-ctc-int8-zh-2024-06-04 | ชาวจีน | 支持多种方言. ดูเพิ่มเติม |
โปรดดู https://k2-fsa.github.io/sherpa/social-groups.html สำหรับ 新一代 Kaldi微信交流群และ QQ 交流群
โดยจะแสดงวิธีใช้ ASR และ TTS Python APIs กับ FastAPI
ใช้การสตรีม ASR ใน C # พร้อมส่วนต่อประสานกราฟิกกับผู้ใช้
วิดีโอสาธิตเป็นภาษาจีน: 【เปิด源】Windows实时字幕软件(网课/เปิดเครื่อง会必备)
ใช้ JavaScript API ของ sherpa-onnx ร่วมกับ Electron
วิดีโอสาธิตเป็นภาษาจีน:爆了!炫神教คุณเปิดเทอม打字挂!真正影响胜率的英雄联盟工具! ภาษาอังกฤษ: 英雄联盟的最后一块拼和游戏中的每个人无障碍沟通!