أطلقت AWS مثيلات Amazon EC2 Trn2 وTrn2UltraServers استنادًا إلى شرائح Trainium2 في مؤتمر re:Invent لعام 2024، بالإضافة إلى شريحة Trainium3 AI من الجيل التالي. لقد أدى الجيل الجديد من المثيلات إلى تحسين الأداء بشكل ملحوظ، كما أن نسبة السعر إلى الأداء أعلى بنسبة 30-40% من الجيل السابق من مثيلات EC2 المستندة إلى وحدة معالجة الرسومات. تمثل هذه الخطوة خطوة مهمة لشركة AWS في مجال حوسبة الذكاء الاصطناعي، حيث توفر إمكانات حوسبة أكثر قوة لتدريب ونشر نماذج لغوية كبيرة، وتعزيز التطبيق على نطاق واسع لتكنولوجيا الذكاء الاصطناعي وتطويرها من خلال التعاون مع شركاء متعددين، مما يؤدي إلى تحسين التكلفة بشكل كبير. فعالية.
في مؤتمر AWS re:Invent لعام 2024، أعلنت Amazon Web Services (AWS) عن إطلاق مثيلات Amazon Elastic Compute Cloud (EC2) استنادًا إلى شرائح Trainium2، المتوفرة رسميًا للمستخدمين. سعر وأداء هذا المثيل الجديد أعلى بنسبة 30-40% من الجيل السابق من مثيلات EC2 المستندة إلى وحدة معالجة الرسومات. قال مات جارمان، الرئيس التنفيذي لشركة AWS: "يسعدني أن أعلن عن التوفر العام لمثيلات Amazon EC2 Trn2 التي تعمل بنظام Trainium2".
بالإضافة إلى مثيلات Trn2، أطلقت AWS أيضًا Trn2UltraServers وعرضت شريحة Trainium3AI من الجيل التالي. تتميز مثيلات Trn2، المجهزة بـ 16 شريحة Trainium2، بأنها قادرة على تقديم ما يصل إلى 20.8 بيتافلوب من أداء الحوسبة، وهي مصممة لتدريب ونشر نماذج لغوية كبيرة (LLMs) بمليارات من المعلمات.
يجمع Trn2UltraServers بين أربعة خوادم Trn2 في نظام واحد، مما يوفر ما يصل إلى 83.2 بيتافلوب من قوة الحوسبة لتحقيق قابلية توسع أعلى. تحتوي هذه الخوادم UltraServers على 64 شريحة Trainium2 مترابطة لتلبية احتياجات الطاقة الحاسوبية للعملاء أثناء التدريب والاستدلال. قال ديفيد براون، نائب رئيس قسم الحوسبة والشبكات في AWS: "إن إطلاق مثيلات Trainium2 وTrn2UltraServers يمنح العملاء قوة الحوسبة التي يحتاجونها لحل نماذج الذكاء الاصطناعي الأكثر تعقيدًا".
عقدت AWS شراكة مع Anthropic لإطلاق مجموعة حوسبة واسعة النطاق تعمل بالذكاء الاصطناعي تسمى Project Rainier، باستخدام مئات الآلاف من شرائح Trainium2. ستدعم هذه البنية التحتية تطوير Anthropic، بما في ذلك تحسين منتجها الرئيسي Claude ليتم تشغيله على أجهزة Trainium2.
بالإضافة إلى ذلك، تعمل شركتا Databricks وHugging Face أيضًا مع AWS للاستفادة من إمكانات Trainium لتحسين الأداء وكفاءة التكلفة لمنتجات الذكاء الاصطناعي الخاصة بهما. وتخطط Databricks لاستخدام الأجهزة لتعزيز منصة Mosaic AI الخاصة بها، بينما تقوم Hugging Face بدمج Trainium2 في أدوات تطوير ونشر الذكاء الاصطناعي الخاصة بها.
ومن بين عملاء Trainium2 الآخرين Adobe وPoolside وQualcomm. وذكر جارمان أنه بعد أن استخدمت Adobe Trainium2 للاختبار المبكر لنموذج الاستدلال Firefly، كانت النتائج مرضية للغاية ومن المتوقع أن توفر الكثير. وأضاف: "تتوقع شركة Poolside توفير 40% مقارنة بالخيارات الأخرى". "تستفيد شركة كوالكوم من برنامج Trainium2 لتطوير أنظمة الذكاء الاصطناعي التي يمكن تدريبها في السحابة ونشرها على الحافة."
بالإضافة إلى ذلك، قامت AWS أيضًا بمعاينة شريحة Trainium3 الخاصة بها، والتي تستخدم عملية 3 نانومتر. من المتوقع أن يتم إطلاق UltraServers المستندة إلى Trainium3 بحلول نهاية عام 2025 وهي مصممة لتوفير أداء أعلى بأربع مرات من Trn2 UltraServers.
لتحسين استخدام أجهزة Trainium، أطلقت AWS أيضًا Neuron SDK، وهي مجموعة أدوات برمجية تساعد المطورين على تحسين النماذج لتحقيق الأداء الأمثل على شرائح Trainium. يدعم SDK أطر عمل مثل JAX وPyTorch، مما يمكّن العملاء من دمج البرنامج في سير العمل الحالي مع الحد الأدنى من تعديلات التعليمات البرمجية.
حاليًا، تتوفر مثيلات Trn2 في منطقة شرق الولايات المتحدة (أوهايو) وسيتم توسيعها لتشمل مناطق أخرى في المستقبل. UltraServers قيد المعاينة حاليًا.
بشكل عام، قدم إطلاق Trainium2 والمنتجات والخدمات ذات الصلة من قبل AWS زخمًا قويًا للتطور السريع في مجال الذكاء الاصطناعي وعزز مكانة AWS الرائدة في مجالات الحوسبة السحابية والذكاء الاصطناعي. في المستقبل، مع إطلاق Trainium3، ستكون مزاياه في مجال حوسبة الذكاء الاصطناعي أكثر أهمية.