أطلقت Play AI بشكل رائع أحدث تحفة فنية لها - الإصدار التجريبي من PlayDialog، وهو نموذج صوتي يعمل بالذكاء الاصطناعي يمكنه إنشاء صوت بودكاست للمحادثة. لا يمكنه فقط ضبط النغمة والعاطفة وسرعة التحدث وفقًا للسياق التاريخي للمحادثة، وتحقيق المزيد من تركيب الكلام الطبيعي، ولكن أيضًا إنشاء تجربة اتصال صوتي غامرة، والتي يمكن أن يطلق عليها علامة فارقة جديدة في الحوار بين الإنسان والكمبيوتر. سيشرح محرر Downcodes بالتفصيل الوظائف القوية لبرنامج PlayDialog وأداته الداعمة PlayNote.
في الآونة الأخيرة، أطلقت Play AI رسميًا منتجها الأكثر طموحًا، وهو الإصدار التجريبي من PlayDialog، والذي يمكنه إنشاء بودكاست صوتي للمحادثة.
يستخدم نموذج الكلام المدعم بالذكاء الاصطناعي الشامل السياق التاريخي للمحادثة للتحكم في النغمة والعاطفة وسرعة الكلام لتحقيق تركيب كلام طبيعي أكثر، مما يمثل مستوى جديدًا من الحوار بين الإنسان والآلة. يعد PlayDialog مناسبًا بشكل خاص لإنشاء تجارب حوار حقيقية، مثل السرد والدبلجة الصوتية والبودكاست المركب وما إلى ذلك. ويمكنه أيضًا توفير تجربة اتصال صوتي غامرة بين شخصين في بيئة الأعمال، على غرار NotebookLM من Google
في الوقت نفسه، أطلقت Play AI أيضًا PlayNote، وهي أداة يمكنها تحويل مجموعة متنوعة من ملفات الوسائط (مثل PDF والنص والفيديو وما إلى ذلك) إلى تجارب محادثة. يمكن للمستخدمين إنشاء ملفات صوتية وعروض تقديمية وروايات وحتى قصص أطفال في دقائق، والاستمتاع بالمؤثرات الصوتية الطبيعية والسلسة التي يقدمها PlayDialog. ما يميز PlayNote هو أنه يوفر أيضًا واجهة API، مما يسمح للمستخدمين بتحقيق إنشاء برمجي للمحتوى الصوتي بسهولة دون الاعتماد على واجهة المستخدم.
تم تدريب الإصدار التجريبي من PlayDialog على مئات الملايين من المحادثات الحقيقية. يبلغ حجم النموذج حوالي عشرة أضعاف حجم Play AI3.0mini، ويمكنه مطابقة أداء الكلام البشري من حيث نغمة الصوت (مثل إيقاع الصوت وسرعة الصوت). خطاب). في الاختبارات العمياء، كان أداء الإصدار التجريبي من PlayDialog ضعف أداء النماذج المنافسة الرائدة في السوق، حيث سجل أعلى الدرجات على وجه الخصوص فيما يتعلق بالتعبير.
على عكس نماذج الكلام السابقة، يمكن لـ PlayDialog beta فهم سياق المحادثة بأكملها، وبالتالي التأثير على تأثير توليد الكلام. قامت Play AI ببناء بنية جديدة تسمى Adaptive Speech contextualizer (ASC)، والتي تمكن النموذج من الاستجابة باستخدام سجل المحادثة الكامل، بحيث لا تكون كل جملة نتيجة معزولة، ولكنها غنية ولها النغمة والعاطفة الصحيحة تجعل النغمة البودكاست الناتج يبدو وكأن المستمع يتواصل في نفس المساحة التي يتواصل بها المتحدث.
سواء كانت مناقشة ديناميكية أو موضوعًا حساسًا يتطلب التعاطف، فإن PlayDialog يتكيف بسلاسة، مما يجعل التفاعلات تبدو أكثر طبيعية وإنسانية.
يمكن للمستخدمين تجربة كل هذا مع PlayNote، واستخدامه لإنشاء روايات قوية وطبيعية وبودكاست وعروض تقديمية والمزيد في دقائق معدودة فقط. يتوفر PlayNote أيضًا من خلال واجهة API، مما يسمح للمطورين بإنشاء محتوى جذاب على نطاق واسع برمجيًا.
مدخل تيا: https://play.ai/playnote
مقدمة المدونة الرسمية: https://blog.play.ai/blog/introducing-playdialog
لا شك أن ظهور PlayDialog وPlayNote سيدفع تكنولوجيا تركيب الكلام بالذكاء الاصطناعي إلى آفاق جديدة ويحدث تغييرات ثورية في إنتاج البودكاست والاتصالات الصوتية والمجالات الأخرى. نحن نتطلع إلى المزيد من الابتكارات المدهشة من Play AI في المستقبل!