تقدم هذه المقالة BiTA، وهي تقنية مبتكرة تعمل على تسريع إنشاء نماذج اللغات الكبيرة (LLMs) من خلال تقنية الضبط ثنائي الاتجاه وفك تشفير الشجرة. إنها تعتمد بنية عالمية وتصميمًا قابلاً للتوصيل، وهي مناسبة بشكل خاص لسيناريوهات التطبيقات في الوقت الفعلي مثل برامج الدردشة الآلية. تنعكس كفاءة BiTA في تحقيق تأثيرات تسارع من 2.1× إلى 3.3× في نطاق واسع من اختبارات مهمة التوليد، كما أن تصميم التلميح القابل للتعديل يجعل من السهل تطبيقه على مختلف LLMs القائمة على المحولات.
في السنوات الأخيرة، قامت BiTA بتسريع توليد نماذج اللغات الكبيرة (LLMs) من خلال الابتكارات التكنولوجية في الضبط ثنائي الاتجاه وفك تشفير الأشجار. من خلال اعتماد بنية عالمية وتصميم قابل للتوصيل، فهو مناسب بشكل خاص لتطبيقات الوقت الفعلي مثل برامج الدردشة الآلية. من خلال الضبط ثنائي الاتجاه والتحقق من مسودة SAR، يتم تحقيق تسريع بدون فقدان لنموذج لغة الانحدار الذاتي. وجدت الدراسة أن BiTA حقق سرعات مذهلة تتراوح من 2.1× إلى 3.3× عند اختباره على مجموعة واسعة من مهام التوليد. إن تصميم التلميح القابل للتعديل الخاص به يجعله طريقة التوصيل والتشغيل التي يمكن استخدامها مع أي ماجستير إدارة أعمال قائم على المحولات يمكن الوصول إليه بشكل عام.لقد أدى ظهور تقنية BiTA إلى تحسينات كبيرة في أداء تطبيق النماذج اللغوية الكبيرة، كما أن كفاءتها وسهولة استخدامها تجعلها تتمتع بآفاق تطبيقية واسعة في المستقبل. يمكن لمزيد من البحث استكشاف أداء BiTA في المزيد من أنواع LLM وسيناريوهات التطبيق، وكيفية تحسين كفاءتها وقابلية التوسع.