أطلقت ByteDance أداة جديدة لإنشاء الموسيقى، Seed-Music، والتي تشبه الساحر الموسيقي الذي يمكنه إنشاء موسيقى عالية الجودة بناءً على أوصاف النص والمراجع الصوتية والنتائج الموسيقية وحتى المطالبات الصوتية. تجمع Seed-Music بين نماذج اللغة الانحدارية ونماذج الانتشار لمنح المستخدمين تحكمًا غير مسبوق في إنشاء الموسيقى، سواء كانت كلمات وموسيقى، أو تعديل اللحن، أو تحويل الصوت إلى غناء، يمكن لـ Seed-Music التعامل معها بسهولة. سيأخذك محرر Downcodes للتعرف على المزيد حول نموذج توليد الموسيقى المذهل هذا.
أصدرت ByteDance مؤخرًا أداة جديدة لإنشاء الموسيقى تسمى Seed-Music. يتيح لك نموذج توليد الموسيقى السحري هذا إنشاء الموسيقى بسهولة من خلال مجموعة متنوعة من طرق الإدخال (مثل الأوصاف النصية والمراجع الصوتية والنتائج الموسيقية وحتى المطالبات الصوتية).
يجمع Seed-Music بين نماذج اللغة الانحدارية ونماذج الانتشار ليس فقط لإنشاء أعمال موسيقية عالية الجودة، بل يسمح لك أيضًا بالتحكم بدقة في تفاصيل الموسيقى. سواء كنت تريد كلمات مصاحبة للموسيقى، أو تريد تعديل اللحن، فلا توجد مشكلة هنا. يمكنك أيضًا تحميل مقطع صوتي قصير، وسيقوم النظام تلقائيًا بتحويله إلى أغنية كاملة، وهو أمر مريح وفعال.
لا يدعم Seed-Music القوي توليد الموسيقى الصوتية والآلات فحسب، بل يتضمن أيضًا سلسلة من الوظائف مثل تركيب صوت الغناء وتحويل صوت الغناء وتحرير الموسيقى، والتي يمكن أن تلبي احتياجات المستخدمين المختلفين. يمكنك إنشاء النوافذ المنبثقة من خلال أوصاف نصية بسيطة، ويمكنك أيضًا ضبط نمط الموسيقى من خلال المطالبات الصوتية، وهو أمر منعش حقًا.
الأمر الأكثر إثارة للاهتمام هو أن بنية Seed-Music مقسمة إلى ثلاث وحدات: وحدة تعلم التمثيل، ووحدة التوليد، ووحدة العرض، والتي تعمل معًا مثل الفرقة الموسيقية لإنشاء موسيقى عالية الجودة من مدخلات متعددة الوسائط.
تقوم وحدة تعلم التمثيل بضغط الإشارة الصوتية الأصلية إلى ثلاثة تمثيلات وسيطة، وهي مناسبة لمختلف مهام إنشاء الموسيقى وتحريرها. تقوم وحدة التوليد بتحويل مدخلات المستخدم إلى تمثيل موسيقي من خلال نماذج الانحدار الذاتي ونماذج الانتشار. وحدة العرض النهائية مسؤولة عن تحويل هذه التمثيلات المتوسطة إلى صوت عالي الجودة يمكن أن تستمتع به أذنيك.
من أجل ضمان جودة الموسيقى، يستخدم Seed-Music مجموعة متنوعة من التقنيات: يقوم نموذج اللغة الانحداري التلقائي بإنشاء رموز صوتية تدريجيًا، ونموذج الانتشار يجعل الموسيقى أكثر وضوحًا من خلال تقليل الضوضاء، ويقوم المشفر الصوتي بترجمة "رموز" الموسيقى هذه إلى دقة عالية قابلة للقراءة لعبت الصوت.
تعد عملية تدريب Seed-Music أيضًا مثيرة جدًا للاهتمام، وتنقسم إلى ثلاث مراحل: ما قبل التدريب، والضبط الدقيق، وما بعد التدريب. من خلال بيانات الموسيقى واسعة النطاق، يكتسب النموذج القدرات الأساسية، ثم يحسن أداء مهام محددة من خلال الضبط الدقيق، وأخيرًا يعمل بشكل مستمر على تحسين النتائج الناتجة من خلال التعلم المعزز.
عنوان المشروع: https://team.doubao.com/en/special/seed-music
لا شك أن ظهور Seed-Music قد جلب إمكانيات جديدة لإنشاء الموسيقى، كما أن تشغيلها المريح ووظائفها القوية ستخفض بشكل كبير عتبة إنشاء الموسيقى، مما يسمح لعدد أكبر من الأشخاص بتجربة متعة إنشاء الموسيقى. نحن نتطلع إلى أن تجلب Seed-Music المزيد من المفاجآت في المستقبل!