أعلنت Tencent اليوم عن المصدر المفتوح لنموذج اللغة الكبير الذي يسمى Hunyuan-Large ، مع مقياس معلمة 398B وحجم معلمة تنشيط 52B. يعمل النموذج بشكل جيد في معايير موثوقة متعددة ، متجاوزًا نماذج مفتوحة المصدر مماثلة مثل Llama 3.1 و Mixtral. تشمل ابتكاراتها التكنولوجية تطبيق بيانات اصطناعية عالية الجودة ، والتي تحل بشكل فعال مشكلة عدم كفاية البيانات الطبيعية ويدعم تسلسل النص تصل إلى 256 ألف ، مما يحسن بشكل كبير إمكانات معالجة النص الطويلة. بالإضافة إلى ذلك ، فتحت Tencent أيضًا مجموعة بيانات التقييم التي تسمى "Penguin Scroll" ، بهدف تعويض عدم وجود مجموعات تقييم نصية طويلة عالية الجودة في الصناعة وتعزيز تطوير تكنولوجيا النماذج الكبيرة.
أصدرت Tencent Today نموذج Large Large Large Open Source Moe Hunyuan-Large ، مع حجم معلمة إجمالي قدره 398B وحجم معلمة تنشيط قدره 52B. تظهر نتائج التقييم العام أن Tencent Hunyuan Large يقود في CMMLU و MMLU و CEVA1 والرياضيات وغيرها من مجموعات التقييم الشاملة متعددة التخصصات ، بالإضافة إلى تسعة أبعاد مثل المهام الصينية والإنجليزية ، والرمز والرياضيات ، وتفوق تخصصات المصدر المفتوح من الدرجة الأولى من الدرجة الأولى كما llama3.1 ونموذج mixtral.
من المفهوم أن هذا النموذج يمكن أن يحقق بيانات اصطناعية عالية الجودة في الابتكار التكنولوجي ، ويتعامل بشكل فعال مع أوجه القصور في البيانات الطبيعية من خلال استخدام البيانات الاصطناعية. فيما يتعلق بقدرات معالجة السياق ، يدعم النموذج الذي تم تدريبه مسبقًا تسلسل النص حتى 256 ألفًا ، مما يعزز بشكل كبير القدرة على التعامل مع مهام السياق الطويلة.
في الوقت نفسه ، أعلن Tencent Hunyuan أنه من أجل ملء أوجه القصور في مجموعات مراجعة المقالات الطويلة الحقيقية في هذه الصناعة ، ستقوم Tencent Hunyuan قريبًا بتعيين مراجعة Scroll Open Penguin للمساعدة في الأبحاث التطبيقية. تعتمد مخطوطات البطريق المتطورة على مجموعة متنوعة من النصوص الطبيعية الطويلة مثل التمويل العام والقانون والأوراق الأكاديمية.
سيوفر إصدار نموذج اللغة الكبير الكبير Tencent Hunyuan والمصدر المفتوح لمجموعة تقييم التمرير البطريق للصناعة نماذج لغوية وأدوات تقييم أكثر قوة لتعزيز تطوير معالجة اللغة الطبيعية والذكاء الاصطناعي.
عنوان الموقع الرسمي: https://llm.hunyuan.tencent.com
وضع المصدر المفتوح لـ Hunyuan-Large والإصدار المتزامن لمراجعة Penguin Scroll ، علامة على اختراق كبير آخر في مجال النماذج اللغوية الكبيرة ، مما يوفر دعمًا قويًا للبحث الأكاديمي والتطبيقات الصناعية ، ويستحق التطلع إلى مستقبله تطوير الذكاء الاصطناعي.