أطلقت Amazon AWS سلسلة Nova من نماذج الذكاء الاصطناعي التوليدي متعدد الوسائط في مؤتمر re:Invent، الذي يغطي إنشاء النصوص والصور والفيديو، بهدف توفير حلول ذكاء اصطناعي أسرع وأقل تكلفة. تتضمن سلسلة Nova أربعة نماذج لإنشاء النصوص (Micro وLite وPro وPremier)، بالإضافة إلى نموذج إنشاء الصور Nova Canvas ونموذج إنشاء الفيديو Nova Reel، لتلبية الاحتياجات ومتطلبات التعقيد لمختلف المستخدمين. تدعم هذه السلسلة من النماذج لغات متعددة ويمكن دمجها بسلاسة مع منصة AWS Bedrock لتسهيل عملية الضبط والتحسين على المستخدمين. تعد AWS أيضًا بإطلاق نماذج تحويل الكلام إلى كلام ونماذج "من أي شخص إلى أي شخص" في المستقبل لتوسيع قدرات سلسلة Nova.
في مؤتمر re:Invent الذي انعقد يوم الثلاثاء، أعلنت Amazon Web Services (AWS) عن إطلاق عائلتها الجديدة من نماذج الذكاء الاصطناعي التوليدية متعددة الوسائط - Nova. تتضمن سلسلة Nova التي تم إصدارها هذه المرة أربعة نماذج لإنشاء النصوص: Micro وLite وPro وPremier بالإضافة إلى ذلك، تم أيضًا إطلاق نموذج إنشاء الصور Nova Canvas ونموذج إنشاء الفيديو Nova Reel.
وقال آندي جاسي، الرئيس التنفيذي لشركة أمازون، إن نماذج Micro وLite وPro ستبدأ في طرحها لعملاء AWS في ذلك اليوم، بينما من المتوقع إصدار نماذج Premier في أوائل عام 2025. تم تصميم سلسلة Nova للتعامل مع نماذج الإدخال المتعددة (بما في ذلك النصوص والصور ومقاطع الفيديو). تم تحسين نموذج إنشاء النص خصيصًا لـ 15 لغة، ويدعم اللغة الإنجليزية بشكل أساسي.
نوفا نموذج توليد النص
تأتي نماذج إنشاء نص Nova بميزات ومواصفات مختلفة. يشتهر الطراز Micro بأقل زمن استجابة واستجابة سريعة، ولكنه يدعم فقط إدخال النص وإخراجه، مما يجعله مناسبًا لمهام المعالجة السريعة. يدعم الطراز Lite معالجة الإدخال السريعة للنصوص والصور ومقاطع الفيديو، بينما يوفر الطراز Pro التوازن بين الدقة والسرعة والتكلفة. يعد Premier هو النموذج الأقوى، وهو مصمم لأحمال العمل المعقدة ومناسب للتطبيقات المتقدمة التي تتطلب نماذج مخصصة.
تختلف النماذج أيضًا في حجم نافذة السياق. يدعم Micro ما يصل إلى حوالي 100000 كلمة، ويمكن لطرازي Lite وPro التعامل مع حوالي 225000 كلمة أو 15000 سطر من التعليمات البرمجية أو 30 دقيقة من المحتوى الصوتي. وقالت AWS أنه بحلول أوائل عام 2025، ستتوسع نافذة السياق لبعض نماذج Nova إلى 2 مليون علامة.
وأكد جاسي أن سلسلة Nova هي أسرع وأرخص نماذج الذكاء الاصطناعي من بين المنتجات المماثلة. ويمكن ضبطها بدقة على منصة تطوير الذكاء الاصطناعي التابعة لشركة AWS AWS Bedrock لتحسين السرعة والكفاءة بشكل أكبر. بالإضافة إلى ذلك، يمكن لسلسلة Nova العمل بسلاسة مع الأنظمة الخاصة وواجهات برمجة التطبيقات لتنفيذ مجموعة متنوعة من مهام الأتمتة.
نوفا كانفاس ونوفا ريل
بالإضافة إلى إنشاء النصوص، أطلقت AWS أيضًا أداتين لإنشاء الصور والفيديو: Nova Canvas وNova Reel. يتيح Nova Canvas للمستخدمين إنشاء الصور وتحريرها عبر المطالبات ويوفر التحكم في نظام الألوان وتخطيط الصور التي تم إنشاؤها. يمكن لـ Nova Reel إنشاء ما يصل إلى ست ثوانٍ من الفيديو استنادًا إلى الإشارات أو الصور المرجعية، وتسمح للمستخدمين بضبط حركة الكاميرا، بما في ذلك التحريك والتدوير والتكبير/التصغير.
وإليكم الصور من قماش:
على الرغم من أن Reel يقتصر حاليًا على إنتاج مقاطع فيديو قصيرة مدتها 6 ثوانٍ، إلا أن AWS تقول إن إصدارات الفيديو الأطول ستتوفر قريبًا. بالإضافة إلى ذلك، تحتوي AWS على ضوابط استخدام مسؤولة مدمجة لهذه الأدوات، بما في ذلك العلامات المائية والإشراف على المحتوى لتجنب إنشاء محتوى ضار.
وكشف جاسي أيضًا أن AWS تعمل على تطوير نموذج تحويل الكلام إلى كلام، والذي من المتوقع إطلاقه في الربع الأول من عام 2025. وسيدعم هذا النموذج إدخال الكلام ويولد خطابًا بشريًا طبيعيًا. بالإضافة إلى ذلك، تعمل AWS أيضًا على تطوير نموذج "من أي شيء إلى أي شخص"، من المتوقع إصداره في منتصف عام 2025، والذي يدعم التحويل متعدد الوسائط عبر النص والصوت والصور والفيديو.
تظل AWS حذرة بشأن سرية بيانات التدريب الخاصة بها وتقول إنها ستوفر سياسة تعويض بشأن قضايا حقوق الطبع والنشر لحماية الحقوق والمصالح المشروعة للعملاء.
مدخل المشروع: https://aws.amazon.com/cn/ai/geneative-ai/nova/
المدونة الرسمية: https://aws.amazon.com/cn/blogs/aws/introducing-amazon-nova-frontier-intelligence-and-industry-leading-price-performance/
بشكل عام، يمثل إطلاق سلسلة AWS Nova مرحلة جديدة في تطوير تقنية الذكاء الاصطناعي التوليدي متعدد الوسائط، وستوفر وظائفها القوية وسرعتها الفعالة والتركيز على الاستخدام المسؤول تجربة ذكاء اصطناعي جديدة للمستخدمين. إن التطوير المستمر والتوسع الوظيفي لسلسلة Nova في المستقبل يستحق التطلع إليه.