أصدرت NVIDIA نموذج AI Audio Model Fugatto مذهل ، مثل عصا سحرية ، مما يمنح المستخدمين القدرة على التحكم في الصوت من خلال الكلمات. Fugatto ليس مجرد مولد صوتي بسيط. تُستخدم آفاق هذا النموذج على نطاق واسع. تُظهر قدرتها القوية المتعددة اللغات والمعالجة المتعددة ، وكذلك التحكم الدقيق في تفاصيل الصوت ، قوته التقنية اختراقها.
تذكر مشهد بطل الرواية في فيلم الخيال العلمي ، هل يمكنك التحكم في الصوت في الإرادة؟ التحكم في الموسيقى والأصوات والصوت عن طريق النص ، وخلق مجموعة متنوعة من تأثيرات السمع الرائعة.
Fugatto ، المعروف باسم "Generation Audio Transformer Opus1" ، هو نموذج معالجة الصوت يعتمد على توليد تقنية الذكاء الاصطناعي. على عكس نماذج الذكاء الاصطناعى الأخرى التي يمكنها فقط إنشاء الموسيقى أو تعديل الصوت ، فإن Fugatto لديها قدرات أكثر قوة ، ويمكنها إنشاء أو تحويل أي مزيج من الموسيقى والصوت والصوت ، ويمكنه فهم وتنفيذ تعليمات المستخدمين الذين يدخلون بواسطة ملفات نصية وصوتية.
تجعل ميزات Fugatto القوية للمستخدمين من جميع مناحي الموسيقى المذهلة للموسيقى ، وشركات الإعلان ، ومطوري أدوات تعلم اللغة ومطوري الألعاب. يمكن للمنتجين الموسيقيين تجربة أنماط الموسيقى والأصوات والآلات الموسيقية المختلفة بسرعة ، وحتى إضافة التأثيرات أو تحسين جودة الصوت للأغاني الموجودة. يمكن لشركات الإعلان استخدامه لإضافة لهجات وعواطف مختلفة للإعلان ، والترويج بسهولة الإعلانات إلى مناطق مختلفة ومجموعات مستهدفة. يمكن لمطوري أدوات تعلم اللغة استخدام Fugatto لتحويل محتوى المنهج إلى الصوت الذي يريده أي مستخدم ، مثل صوت الأسرة أو الأصدقاء لجعل التعلم أكثر تخصيصًا. يمكن لمطوري الألعاب استخدام Fugatto لتعديل المواد الصوتية في اللعبة في الوقت الفعلي وفقًا لعملية اللعبة ، أو إدخال إنشاء مؤثرات صوت جديدة وفقًا لتعليمات النص وإدخال الصوت.
سحر Fugatto هو أنه يمكن أن يفهم وتوليد الصوت مثل البشر. لا يمكن فقط تنفيذ التعليمات المحددة التي قدمها المستخدم ، ولكن أيضًا إنشاء أصوات جديدة غير مسبوقة. على سبيل المثال ، يمكن أن يجعل الصراخ الصغير ويترك نسيس الساكسفون يصنع قطة.
تتمثل القدرة الأخرى التي تقدمها فوجاتو في أنه يمكن أن يجمع بين التعليمات المستفادة بشكل منفصل أثناء عملية التدريب لتوليد تأثيرات أكثر تعقيدًا. على سبيل المثال ، يمكن للمستخدمين أن يطلبوا ذلك لإنشاء صوت لهجة فرنسية مع مشاعر حزينة. الأمر الأكثر إثارة للدهشة هو أن Fugatto يسمح أيضًا للمستخدمين بإجراء تعديلات خفية على التعليمات ، مثل التحكم في درجة لهجة قوية أو شدة الحزن ، بحيث يمكن للمستخدمين إنشاء مثل الفنانين.
يمكن لـ Fugatto أيضًا توليد صوت التغييرات بمرور الوقت. يمكن للمستخدمين التحكم بدقة في تغيير الصوت وإنشاء مجموعة متنوعة من المؤثرات الصوتية الحية.
Fugatto هو نتيجة للباحثين من قبل الباحثين في جميع أنحاء العالم. تتيح خلفيتها المتنوعة Fugatto أن يكون لديها قدرات معالجة متعددة اللغات أكثر قوة.
ولادة Fugatto هي تبلور Nvidia في مجالات النمذجة الصوتية ، وترميز الصوت ، وفهم الصوت. يستخدم 2.5 مليار معلمة ويتم تدريبه على مجموعة نظام NVIDIA DGX المزودة بـ 32 NVIDIA H100TENSOR CORE GPU.
علامات فوجاتو على أن تكنولوجيا معالجة الصوت قد دخلت حقبة جديدة. سيؤدي ذلك إلى إمكانيات غير محدودة لمختلف المجالات مثل الموسيقى والأفلام والألعاب والتعليم ، ودعنا نتطلع إلى إنشاء المزيد من الأعياد السمعية المذهلة!
المدونة الرسمية: https://blogs.nvidia.com/blog/fugatto-gen-sound-model/
إن ظهور Fugatto ليس فقط تقدم العلوم والتكنولوجيا ، ولكن أيضًا امتدادًا لا حصر له للإبداع. إنه يوفر للفنانين والمطورين أدوات إبداعية غير مسبوقة ، ويشير أيضًا إلى إمكانيات لا حصر لها لتكنولوجيا الصوت في المستقبل. دعنا ننتظر ونرى كيف سيغير Fugatto عالم السمع لدينا.