يبدو أن Fugatto، أحدث طراز للذكاء الاصطناعي أصدرته NVIDIA، يتمتع بقوة سحرية ويحدث ثورة كاملة في تكنولوجيا معالجة الصوت. لا يمكنه فقط إنشاء مزيج من الموسيقى والصوت والصوت، بل يمكنه أيضًا فهم وتنفيذ التعليمات التي يدخلها المستخدمون من خلال الملفات النصية والصوتية، مما يجعل من الممكن إنشاء مجموعة متنوعة من التأثيرات السمعية الرائعة. سيأخذك محرر Downcodes إلى فهم متعمق لنموذج الذكاء الاصطناعي المدمر هذا ويرى كيف يمكنه تحويل مشاهد من أفلام الخيال العلمي إلى واقع ملموس.
يعد Fugatto، واسمه الكامل "Foundational Geneative Audio Transformer Opus1"، نموذجًا لمعالجة الصوت يعتمد على تقنية الذكاء الاصطناعي التوليدية. على عكس نماذج الذكاء الاصطناعي الأخرى التي يمكنها فقط إنشاء الموسيقى أو تعديل الكلام، يتمتع Fugatto بقدرة أقوى على إنشاء أو تحويل أي مزيج من الموسيقى والكلام والأصوات، وهو قادر على فهم وتنفيذ التعليمات التي يدخلها المستخدمون من خلال الملفات النصية والصوتية.
لقد أذهلت ميزات Fugatto القوية المستخدمين من جميع مناحي الحياة، بما في ذلك منتجي الموسيقى ووكالات الإعلان ومطوري أدوات تعلم اللغة ومطوري الألعاب. يمكن لمنتجي الموسيقى استخدامه لتجربة الأنماط الموسيقية والأغاني والآلات الموسيقية المختلفة بسرعة، وحتى إضافة تأثيرات أو تحسين جودة الصوت للأغاني الموجودة. يمكن لشركات الإعلان استخدامها لإضافة لهجات ومشاعر مختلفة إلى دبلجة الإعلانات، وترويج الإعلانات بسهولة في مناطق مختلفة وفئات مستهدفة. يمكن لمطوري أدوات تعلم اللغة استخدام Fugatto لتحويل محتوى الدورة إلى أي صوت يريده المستخدم، مثل صوت أحد أفراد العائلة أو الأصدقاء، لجعل التعلم أكثر تخصيصًا. يمكن لمطوري الألعاب استخدام Fugatto لتعديل المواد الصوتية داخل اللعبة في الوقت الفعلي بناءً على تقدم اللعبة، أو إنشاء مؤثرات صوتية جديدة للعبة بناءً على الأوامر النصية وإدخال الصوت.
يكمن سحر Fugatto في قدرته على فهم الأصوات وتوليدها تمامًا مثل الإنسان. لا يمكنه تنفيذ تعليمات محددة يقدمها المستخدم فحسب، بل يمكنه أيضًا إنشاء أصوات جديدة لم يتم سماعها من قبل. على سبيل المثال، يمكن أن يجعل البوق يصدر صوت كلب، والساكسفون يصدر صوت قطة، طالما أن المستخدم يستطيع وصفه، يمكن لـ Fugatto إنشائه.
ملاحظة لمصدر الصورة: تم إنشاء الصورة بواسطة الذكاء الاصطناعي، والصورة معتمدة من قبل مزود الخدمة Midjourney
القدرة الرائدة الأخرى لـFugatto هي قدرته على الجمع بين التعليمات التي تم تعلمها بشكل منفصل أثناء التدريب لإنتاج تأثيرات أكثر تعقيدًا. على سبيل المثال، يمكن للمستخدمين أن يطلبوا منه إصدار صوت بلكنة فرنسية مع مشاعر حزينة. والأكثر إثارة للدهشة هو أن Fugatto يتيح للمستخدمين أيضًا إجراء تعديلات دقيقة على التعليمات، مثل التحكم في سمك اللكنة أو شدة الحزن، مما يسمح للمستخدمين بالإبداع مثل الفنان.
يمكن لـ Fugatto أيضًا إصدار أصوات تتغير بمرور الوقت، مثل اقتراب العاصفة من مسافة بعيدة وتزايد شدة الرعد قبل أن يتلاشى ببطء في المسافة. يمكن للمستخدمين التحكم بدقة في عملية تغيير الصوت وإنشاء مجموعة متنوعة من المؤثرات الصوتية الحية.
فوجاتو هو جهد تعاوني بين باحثين من جميع أنحاء العالم، مع أعضاء فريق من دول مثل الهند والبرازيل والصين والأردن وكوريا الجنوبية. خلفياتهم المتنوعة تمنح Fugatto قدرات أكبر متعددة اللهجات واللغات.
إن ميلاد Fugatto هو تتويج لسنوات من البحث الذي أجرته NVIDIA في مجالات نمذجة الكلام، والترميز الصوتي، وفهم الصوت. يستخدم 2.5 مليار معلمة ويتم تدريبه على مجموعة من أنظمة NVIDIA DGX المجهزة بـ 32 وحدة معالجة رسوميات NVIDIA H100Tensor Core.
يمثل ظهور Fugatto حقبة جديدة في تكنولوجيا معالجة الصوت. ستوفر إمكانيات غير محدودة لمختلف المجالات مثل الموسيقى والأفلام والألعاب والتعليم وما إلى ذلك. دعونا نتطلع إلى خلق المزيد من الأعياد السمعية المذهلة!
المدونة الرسمية: https://blogs.nvidia.com/blog/fugatto-gen-ai-sound-model/
يبشر ظهور Fugatto بالإمكانات الهائلة للذكاء الاصطناعي في مجال الصوت، مما لا شك فيه أن وظائفه القوية وطرق تشغيله المريحة ستجلب ابتكارًا غير مسبوق في جميع مناحي الحياة. دعونا ننتظر ونرى كيف سيستمر فوجاتو في تشكيل عالمنا السمعي في المستقبل!