الإنجليزية | 简体中文 | البرتغالية | 日本語 | شكرا
تم إصدار قاعدة التعليمات البرمجية هذه وجميع الطرازات بموجب ترخيص CC-BY-NC-SA-4.0. يرجى الرجوع إلى الترخيص لمزيد من التفاصيل.
تحويل النص إلى كلام بدون لقطة وقليل من تحويل النص إلى كلام: أدخل عينة صوتية مدتها من 10 إلى 30 ثانية لإنشاء مخرجات تحويل النص إلى كلام عالية الجودة. للحصول على إرشادات مفصلة، راجع أفضل ممارسات استنساخ الصوت.
دعم متعدد اللغات وعبر اللغات: ما عليك سوى نسخ النص متعدد اللغات ولصقه في مربع الإدخال، فلا داعي للقلق بشأن اللغة. يدعم حاليًا اللغة الإنجليزية واليابانية والكورية والصينية والفرنسية والألمانية والعربية والإسبانية.
لا يوجد اعتماد على الصوتيات: يتمتع النموذج بقدرات تعميمية قوية ولا يعتمد على الصوتيات في تحويل النص إلى كلام (TTS). يمكنه التعامل مع النص بأي لغة نصية.
دقة عالية: يحقق معدل CER (معدل خطأ الأحرف) وWER (معدل خطأ الكلمات) منخفضًا يبلغ حوالي 2% للنصوص الإنجليزية التي تبلغ مدتها 5 دقائق.
سريع: مع تسريع تكنولوجيا الأسماك، يبلغ عامل الوقت الفعلي حوالي 1:5 على الكمبيوتر المحمول Nvidia RTX 4060 و1:15 على Nvidia RTX 4090.
WebUI Inference: يتميز بواجهة مستخدم ويب سهلة الاستخدام ومعتمدة على Gradio ومتوافقة مع Chrome وFirefox وEdge والمتصفحات الأخرى.
استدلال واجهة المستخدم الرسومية: يقدم واجهة رسومية PyQt6 تعمل بسلاسة مع خادم API. يدعم أنظمة Linux، وWindows، وmacOS. انظر واجهة المستخدم الرسومية.
سهولة النشر: يمكنك إعداد خادم استدلال بسهولة مع دعم أصلي لأنظمة التشغيل Linux وWindows وMacOS، مما يقلل من فقدان السرعة.
نحن لا نتحمل أي مسؤولية عن أي استخدام غير قانوني لقاعدة التعليمات البرمجية. يرجى الرجوع إلى القوانين المحلية الخاصة بك بشأن قانون الألفية الجديدة لحقوق طبع ونشر المواد الرقمية والقوانين الأخرى ذات الصلة.
صوت السمك
الاستدلال.ipynb
إنجليزي
中文
日本語
البرتغالية (البرازيل)
إنجليزي
中文
日本語
البرتغالية (البرازيل)
فيتس 2 (دانييلروبنيكوف)
بيرت فيتس2
جي بي تي فيتس
MQTTS
GPT سريع
جي بي تي-سوفيتس
راعي معالجة البيانات بواسطة 6Block
يتم تقديم Fish Audio على موقع Lepton.AI