علم محرر موقع Downcodes أن باحثين من كلية علوم البيانات بجامعة موساشينو قد حققوا مؤخرًا تقدمًا كبيرًا وطوروا خوارزمية جديدة تسمى AMT-APC، والتي يمكنها إنشاء موسيقى البيانو تلقائيًا بشكل أكثر دقة. تعتمد هذه التقنية على نموذج النسخ التلقائي للموسيقى (AMT)، من خلال الضبط الدقيق الذكي، تعمل على تحسين مستوى جودة الصوت والتعبير لموسيقى البيانو التي تم إنشاؤها بشكل كبير، والتغلب على دقة جودة الصوت ومشاكل الأداء للجيل السابق من موسيقى البيانو التلقائي. - الاختناقات مثل عدم كفاية الطاقة. يكمن ابتكار هذه الخوارزمية في إستراتيجيتها الفريدة المكونة من خطوتين: أولاً، يتم استخدام نموذج AMT المُدرب مسبقًا لالتقاط التفاصيل الصوتية المختلفة في الموسيقى، ثم يتم ضبطها بدقة من خلال مجموعة بيانات مقترنة تحتوي على صوت الموسيقى الأصلي والبيانو. أداء ملفات MIDI والنتيجة هي إصدار أداء بيانو أقرب إلى أسلوب الأغنية الأصلية. بالإضافة إلى ذلك، قدم الباحثون أيضًا مفهوم "ناقل الأسلوب" لزيادة تحسين التعبير عن موسيقى البيانو المولدة.
لفترة طويلة، واجهت تقنية توليد موسيقى البيانو تلقائيًا تحديًا يتمثل في عدم كفاية جودة الصوت والدقة والتعبير. غالبًا ما تتمكن النماذج الحالية من توليد ألحان وإيقاعات بسيطة فقط، ولا يمكنها التقاط التفاصيل والعواطف الغنية في الأغاني الأصلية.
تتبع خوارزمية AMT-APC نهجًا مختلفًا، فهي تستخدم أولاً نموذج AMT مُدرب مسبقًا "لالتقاط" الأصوات المختلفة في الموسيقى بدقة، ثم تطبقه على مهمة أداء البيانو التلقائي (APC) من خلال الضبط الدقيق.
يكمن جوهر خوارزمية AMT-APC في الإستراتيجية المكونة من خطوتين:
الخطوة الأولى: التدريب المسبق. اختار الباحثون نموذج AMT عالي الأداء يسمى hFT-Transformer كأساس وقاموا بتدريبه باستخدام مجموعة بيانات MAESTRO، مما يجعله قادرًا على معالجة مقاطع موسيقية أطول.
الخطوة 2: الضبط الدقيق. أنشأ الباحثون مجموعة بيانات مقترنة تحتوي على ملفات MIDI للصوت والموسيقى الأصلية لأداء البيانو، واستخدموا مجموعة البيانات هذه لضبط نموذج AMT حتى يتمكن من إنشاء نسخة أداء بيانو أكثر اتساقًا مع نمط الموسيقى الأصلية. .
من أجل جعل موسيقى البيانو الناتجة أكثر تعبيرًا، قدم الباحثون أيضًا مفهومًا يسمى "ناقل النمط". ناقلات النمط عبارة عن مجموعة من الميزات المستخرجة من كل إصدار لأداء البيانو، بما في ذلك توزيع معدل بداية النوتة الموسيقية وتوزيع السرعة وتوزيع درجة الصوت. من خلال إدخال متجهات الأنماط في النموذج إلى جانب الصوت الموسيقي الأصلي، تستطيع خوارزمية AMT-APC تعلم أنماط العزف المختلفة وعكسها في موسيقى البيانو التي تم إنشاؤها.
تظهر النتائج التجريبية أنه بالمقارنة مع نماذج العزف على البيانو التلقائية الحالية، فإن موسيقى البيانو الناتجة عن خوارزمية AMT-APC تتمتع بتحسينات كبيرة في دقة جودة الصوت والتعبير. باستخدام مقياس يسمى Qmax لتقييم التشابه بين الأغنية الأصلية والصوت الناتج، حقق نموذج AMT-APC أدنى قيمة Qmax، مما يعني أنه أكثر قدرة على استعادة خصائص الأغنية الأصلية.
توضح هذه الدراسة أن AMT وAPC مهمتان مرتبطتان بشكل كبير، واستخدام نتائج أبحاث AMT الحالية يمكن أن يساعدنا في تطوير نماذج APC أكثر تقدمًا. في المستقبل، يخطط الباحثون لمواصلة استكشاف نماذج AMT الأكثر ملاءمة لتطبيقات APC، من أجل تحقيق عزف تلقائي أكثر واقعية وتعبيرًا على البيانو.
عنوان المشروع: https://misya11p.github.io/amt-apc/
عنوان الورقة: https://arxiv.org/pdf/2409.14086
لقد جلب نجاح خوارزمية AMT-APC إمكانيات جديدة إلى مجال توليد الموسيقى تلقائيًا، ويشير أيضًا إلى أن تقنية توليد الموسيقى التلقائية الأكثر واقعية وتعبيرًا ستأتي في المستقبل. ونحن نتطلع إلى أن يواصل الباحثون المستقبليون الاستكشاف على هذا الأساس ويجلبون لنا المزيد من المفاجآت!