تقارير محرر الرموز السفلية: أصدرت Oute AI مؤخرًا طريقة جديدة لتحويل النص إلى كلام -OuteTTS-0.1-350M. نموذج تحويل النص إلى كلام (TTS) هذا يعتمد على بنية LLaMa، مع بنيته البسيطة وWavTokenizer الفعال، ويحقق تركيبًا عالي الجودة للكلام دون الحاجة إلى محولات خارجية. فهو لا يتمتع بإمكانيات استنساخ الصوت بدون عينة فحسب، بل إنه متوافق أيضًا مع llama.cpp، مما يجعله مثاليًا للتطبيقات في الوقت الفعلي. لا شك أن إصدار OuteTTS-0.1-350M يجلب اختراقات جديدة في تطوير تقنية تحويل النص إلى كلام.
أصدرت Oute AI مؤخرًا طريقة جديدة لتحويل النص إلى كلام تسمى OuteTTS-0.1-350M. ويستفيد هذا النهج من نمذجة اللغة النقية دون الحاجة إلى محولات خارجية أو بنيات معقدة، مما يوفر نهجًا مبسطًا لتحويل النص إلى كلام (TTS). يعتمد OuteTTS-0.1-350M على بنية LLaMa ويستخدم WavTokenizer لإنشاء الرموز الصوتية مباشرة، مما يجعل العملية أكثر كفاءة.
يتميز النموذج باستنساخ الصوت بدون عينة، والذي يتطلب بضع ثوانٍ فقط من الصوت المرجعي لتكرار صوت جديد. تم تصميم OuteTTS-0.1-350M لأداء الجهاز وهو متوافق مع llama.cpp، مما يجعله مثاليًا للتطبيقات في الوقت الفعلي. على الرغم من أن النموذج يحتوي على حجم معلمة صغير نسبيًا (350 مليونًا)، إلا أن أدائه يمكن مقارنته بأنظمة TTS الأكبر والأكثر تعقيدًا.
إن إمكانية الوصول إلى OuteTTS-0.1-350M وكفاءته تجعله مناسبًا لمجموعة واسعة من التطبيقات، بما في ذلك المساعدين الشخصيين والكتب الصوتية وتوطين المحتوى. تم إصدار Oute AI بموجب ترخيص CC-BY، والذي يشجع على المزيد من التجريب والتكامل في مشاريع مختلفة، مما يؤدي إلى إضفاء الطابع الديمقراطي على تكنولوجيا تحويل النص إلى كلام (TTS) المتقدمة.
يمثل إصدار OuteTTS-0.1-350M خطوة رئيسية للأمام في مجال تقنية تحويل النص إلى كلام، مع الاستفادة من البنية المبسطة لتقديم تركيب كلام عالي الجودة مع الحد الأدنى من المتطلبات الحسابية. إنه يدمج بنية LLaMa، ويستخدم WavTokenizer، وهو قادر على إجراء استنساخ الكلام بدون عينة بدون محولات معقدة، مما يميزه عن نماذج TTS التقليدية.
العنوان: https://www.outei.com/blog/OuteTTS-0.1-350M
بشكل عام، يوفر OuteTTS-0.1-350M إمكانيات جديدة لمجال تحويل النص إلى كلام بفضل كفاءته وبساطته وإمكانية الوصول إليه، ويستحق التطلع إلى أدائه في التطبيقات المستقبلية. سيستمر محرر Downcodes في الاهتمام بالتطوير اللاحق لهذا النموذج.