sherpa
doc
sherpa
เป็นเฟรมเวิร์กการอนุมานคำพูด-ข้อความ-ข้อความแบบโอเพ่นซอร์ส โดยใช้ PyTorch โดยเน้นไปที่โมเดลแบบ end-to-end (E2E) โดยเฉพาะ นั่นคือโมเดลที่ใช้ทรานสดิวเซอร์และ CTC มีทั้ง C++ และ Python API
โครงการนี้มุ่งเน้นไปที่การใช้งาน เช่น การใช้แบบจำลองที่ได้รับการฝึกอบรมล่วงหน้าเพื่อถอดเสียงคำพูด หากคุณสนใจวิธีการฝึกฝนหรือปรับแต่งโมเดลของคุณเอง โปรดดูที่ icefall
เรายังมีโปรเจ็กต์ ที่คล้ายกัน อื่นๆ ที่ไม่ต้องใช้ PyTorch:
sherpa-onnx
และsherpa-ncnn
ยังรองรับ iOS, Android และระบบฝังตัวอีกด้วย
โปรดดู เอกสารประกอบ ที่https://k2-fsa.github.io/sherpa/
ลองใช้ sherpa
จากภายในเบราว์เซอร์ของคุณโดยไม่ต้องติดตั้งอะไรเลย: https://huggingface.co/spaces/k2-fsa/automatic-speech-recognition