أفاد محرر Downcodes: في جولة Volcano Engine AI Innovation Tour لعام 2024، أصدرت ByteDance أحدث التقدم في سلسلة Doubao من نماذج الذكاء الاصطناعي، بما في ذلك نموذج Doubao · Music الذي طال انتظاره ونموذج Doubao · الترجمة الفورية، كما أولت اهتمامًا لـ Doubao تمت ترقية النموذج العام الاحترافي ونموذج الرسم البياني Vincentian ونموذج تركيب الكلام وما إلى ذلك بشكل كبير. لا تعمل هذه الترقيات على تحسين أداء وكفاءة النموذج فحسب، بل توفر أيضًا للمستخدمين تجربة ذكاء اصطناعي أكثر ملاءمة وأكثر ذكاءً. يمثل هذا الإصدار تصميم Volcano Engine على مواصلة الابتكار في مجال تكنولوجيا الذكاء الاصطناعي، ويظهر أيضًا قوتها القوية في إنشاء الموسيقى والتواصل بين اللغات وغيرها من المجالات.
في جولة الابتكار في Volcano Engine AI لعام 2024 اليوم، بالإضافة إلى نموذج إنشاء الفيديو، أصدرت ByteDance أيضًا نموذج Doubao · Music ونموذج Doubao · الترجمة الفورية، وأعلنت عن نموذج Doubao العالمي pro، ونموذج الرسم البياني Vincentian، ونموذج تركيب الكلام، وما إلى ذلك تمت ترقية النموذج العمودي بشكل كبير.
يمثل إطلاق Doubao Music Model التخطيط المتعمق لـ Volcano Engine في مجال إنشاء الموسيقى. يتيح هذا النموذج حرية إنشاء الموسيقى عالية الجودة من خلال دعم الخوارزمية القوية. فيما يتعلق بتوليد كلمات الأغاني، يمكن إدخال بضع كلمات بسيطة فقط لإنشاء كلمات الأغاني بسرعة مع تعبير عاطفي دقيق ومفهوم فني عميق. فيما يتعلق بإنشاء اللحن، يوفر Doubao·Music Model أكثر من 10 أنماط موسيقية مختلفة وخيارات التعبير العاطفي لتلبية الاحتياجات المتنوعة للمبدعين.
وفي الوقت نفسه، بمساعدة تقنية تركيب الكلام القوية من Doubao، يصبح تأثير الغناء نابضًا بالحياة وواقعيًا تقريبًا، مما يوفر للمستخدمين تجربة استماع غامرة. بالإضافة إلى ذلك، يخفض هذا النموذج أيضًا عتبة إنشاء الموسيقى ويدعم طرق إنشاء متعددة مثل الصور في الموسيقى، والإلهام في الموسيقى، وكتابة الكلمات في الموسيقى، وما إلى ذلك، مما يسمح لمزيد من الأشخاص بالمشاركة بسهولة في إنشاء الموسيقى.
من ناحية أخرى، أحدث إصدار نموذج الترجمة الفورية دوباو تغييرات ثورية في التواصل بين اللغات. يحقق هذا النموذج زمن وصول منخفض للغاية للترجمة في الوقت الفعلي، ويمكن للمستخدمين رؤية نتائج الترجمة أثناء التحدث، مما يحسن كفاءة الاتصال بشكل كبير. فيما يتعلق بجودة الترجمة، يتمتع نموذج الترجمة الفورية Doubao بأداء سلس وطبيعي وعالي الدقة، يقترب أو حتى يفوق مستوى الترجمة الفورية البشرية في العديد من السيناريوهات مثل المكتب والقانون والتعليم. ما تجدر الإشارة إليه بشكل خاص هو أن هذا النموذج يدعم أيضًا وظيفة استنساخ الجرس، والتي يمكنها تحقيق ترجمة عبر اللغات لنفس الجرس، وكسر حواجز الاتصال بتعبير صوتي أكثر حيوية وواقعية، وجعل الاتصال عبر اللغات أكثر سلاسة وسلاسة.
عنوان التجربة: https://www.volcengine.com/product/doubao
بشكل عام، تُظهر ترقيات نموذج الذكاء الاصطناعي لسلسلة Doubao من ByteDance والنماذج الجديدة التي تم إصدارها هذه المرة قوتها القوية وقدراتها الابتكارية في مجال الذكاء الاصطناعي، مما يوفر للمستخدمين تجربة ذكاء اصطناعي أكثر ملاءمة وأكثر ذكاءً، ومن الجدير التطلع إلى التحديثات المستقبلية وتطوير سيناريوهات التطبيق المتعددة. يتطلع محرر Downcodes إلى إطلاق المزيد من الميزات المثيرة في المستقبل!