أصدر تسوي لينغ لينغ، المدير العام لقسم شؤون براءات الاختراع في مجموعة بايدو، "أفضل عشرة اختراعات تكنولوجية لبايدو في عام 2024": اختراعات بايدو المتطورة الحاصلة على براءات اختراع في مجال الذكاء الاصطناعي، والتي تغطي اختراقات شاملة من الخوارزميات الأساسية إلى التطبيق سيناريوهات. وفقًا لـ "تقرير تحليل تكنولوجيا براءات الاختراع للجيل الجديد من الذكاء الاصطناعي" الصادر عن المركز الوطني لأبحاث تطوير أمن المعلومات الصناعية ومركز الملكية الفكرية الإلكترونية التابع لوزارة الصناعة وتكنولوجيا المعلومات في أبريل من هذا العام، اعتبارًا من نهاية عام 2023، بايدو تقدمت بطلب للحصول على 19,308 براءة اختراع في مجال الذكاء الاصطناعي بأكمله ومنحت 9,260 براءة اختراع، واحتلت بايدو المرتبة الأولى في الصين لمدة ست سنوات متتالية في مجال الجيل الجديد من الذكاء الاصطناعي مع نماذج كبيرة كجوهر، وتقدمت بايدو بطلب للحصول على 1,432 براءة اختراع وأذنت بـ 651؛ أن تصبح رائدة في مجال الابتكار التكنولوجي وتخطيط براءات الاختراع. وفقًا لرؤى مشهد براءات الاختراع للذكاء الاصطناعي التوليدي الصادرة عن منظمة قاعدة بيانات براءات الاختراع IFIclaims، تعد تطبيقات براءات الاختراع للذكاء الاصطناعي التوليدي من بايدو من بين أفضل 10 تطبيقات في العالم، وهو الابتكار الصيني الوحيد الذي يدخل القائمة، وتغطي التكنولوجيا الحاصلة على براءة اختراع النص والصورة والصوت والفيديو في المجال الأساسي الكبير، أصبحت واحدة من الشركات الأربع في العالم ذات التخطيط الشامل في هذه المجالات الأربعة.
في 12 نوفمبر، سيُعقد Baidu World 2024 تحت شعار "التطبيقات هنا" في شنغهاي. وباعتباره مؤتمرًا تكنولوجيًا رفيع المستوى لهذا العام، ستصدر بايدو أيضًا أحدث نتائجها، لتجلب مرة أخرى اختراقات تكنولوجية لافتة للنظر وإطلاق المنتجات.
وفيما يلي أهم عشرة اختراعات تكنولوجية متطورة لشركة بايدو في عام 2024:
1. تكنولوجيا الوكيل تعتمد على النماذج الكبيرة التوليدية
تقدم تقنية الاختراع هذه بشكل مبتكر نموذجًا للتفكير، مما يمكّن الوكيل من الحصول على قدرات متعددة مثل تخطيط المهام، واستدعاء الأدوات، وتعزيز المعرفة، والتطور الانعكاسي. من خلال التصميم المنهجي والتحسين الاتجاهي للقدرات الأساسية، يمكنه دعم بناء ونشر الوكلاء على نطاق واسع في سيناريوهات التطبيقات المختلفة بتكلفة منخفضة من خلال بناء قدرات محاكاة واسعة النطاق، ويمكنه تسريع بناء الوكلاء وتوزيعهم. تم استخدام هذا النظام الفني بنجاح في العديد من السيناريوهات الرئيسية مثل Wenxin Intelligent Platform، وMerchant Intelligent Agent، وWenxin Quick Code، وما إلى ذلك، مما أدى إلى تحسين كفاءة البحث والتطوير للوكلاء الأذكياء بشكل كبير وخفض عتبة البحث والتطوير. من بينها، يستخدم الوكلاء التجاريون تقنية التخطيط + التعاون متعدد النماذج وتقنية المحاكاة واسعة النطاق لتحسين قدرتهم على التفكير وتطوير واستخدام الأدوات وبناء قدرات تسويق الذكاء الاصطناعي؛ ويعتمد Wenxin Kuaicode على توصيات التعليمات البرمجية وأنظمة الوكلاء للتكامل معها DevOps التقليدية: يعزز المزيج العضوي من سلاسل الأدوات الاستكشاف المتعمق وتنفيذ البرمجة الثنائية التعاونية بين الإنسان والآلة.
2. تقنية التطور المشترك متعدد النماذج بناءً على إطار تدريب فعال للنموذج الكبير
تتغلب هذه التكنولوجيا المبتكرة على سلسلة من المشكلات الصعبة من المنظور الهندسي والخوارزمي. فيما يتعلق بالهندسة المعمارية، تشمل الاختراقات المبتكرة الشاملة استراتيجيات متوازية هجينة، وكفاءة الاتصال، وتحسين الحوسبة والتخزين، مما يحسن بشكل كبير أداء التدريب لنماذج اللغة الكبيرة ويدعم التدريب الفعال والمستقر لسلسلة نماذج Wenxin بأكملها في جميع أنحاء العالم. عملية. فيما يتعلق باستراتيجيات الخوارزمية، قمنا بتطوير تقنية ما قبل التدريب للتعاون بين النماذج الكبيرة والصغيرة، والتغلب على المشكلة التقنية المتمثلة في صعوبة وراثة المعرفة بين النماذج، وتغيير نموذج التدريب للنماذج التقليدية، وتقليل تكلفة تدريب النماذج الجديدة. بناءً على هذا الاختراع، تم إنشاء حواجز تقنية أمام النماذج ذات الأحجام المختلفة، مما أدى إلى زيادة إنتاجية التدريب لنموذج Wenxin الكبير بمقدار 4.1 مرات في العام الماضي، مما يدعم Wenxin Yiyan لتلبية مجموعة واسعة من الشركات ذات الاحتياجات المختلفة بكفاءة وتمكينها. الآلاف من الصناعات.
3. نظام ذكي يدمج إنشاء المحتوى متعدد الوسائط وتجميعه بناءً على نماذج كبيرة وتكنولوجيا تعزيز استرجاع المعرفة
تستخدم تقنية هذا الاختراع بشكل شامل تقنيات مثل تعزيز المعرفة، وتحليل المحتوى متعدد المصادر، والتحرير المتكامل، والمعجم المعزز للاسترجاع لحل المشكلات مثل ضعف جودة الإنتاج للمقالات الطويلة الاحترافية والمحتوى متعدد الوسائط، وعدم القدرة على مشاركة الحاويات عندما الإنشاء والتحرير، وضعف دقة النص الرئيسي للمعجم. يهدف استرجاع الصور النصية المحسنة إلى معالجة الصور المرجعية بشكل تكيفي من خلال الحكم الذكي على احتياجات المستخدم. يعمل نظام إنشاء الصور ذو الوضع المختلط على تحسين اتساق الجسم الرئيسي للصورة بشكل فعال، مما يعوض بشكل فعال عن أوجه القصور في وصف المحتوى الطويل غير الدقيق. بشكل عام، التأثير يتجاوز بكثير النظام الأصلي لـ Wenshengtu. حققت Baidu Wenku إنجازات عظيمة في إنشاء تقارير أبحاث الصناعة والعروض التقديمية والخرائط الذهنية والكتب المصورة في الوقت الفعلي بناءً على تعليمات المستخدم والمحتوى الذي تم تحميله، وتدعم المهام المعقدة مثل التحرير الشامل والتحويل عبر الوسائط والعام/ رسومات شخصية تحسين كبير في الأداء. في أغسطس 2024، أصدرت شركة Yuehu Data من Aurora تقريرًا يوضح أن حصة Baidu Wenku الذكية في سوق PPT قد وصلت إلى 80% في الأشهر الثلاثة الماضية، وصل معدل النمو المركب لحجم المستخدم إلى 23%، ويتجاوز معدل النمو مستوى الصناعة بكثير. .
4. دعم تحديد المواقع القيادة الذاتية على نطاق واسع وتكنولوجيا إنشاء الخرائط على مستوى الممرات
تخترق هذه التكنولوجيا المبتكرة مشاكل الكفاءة والتكلفة للنموذج التقليدي، وتقلل من تكلفة إنتاج الخرائط بنسبة 95%، ويبلغ طول الطريق على مستوى الحارة أكثر من 3.6 مليون كيلومتر، مما يحقق تغطية كاملة لأكثر من 41000 منطقة حضرية وريفية. المدن في جميع أنحاء البلاد. تتميز تقنية تحديد المواقع عالية الدقة للقيادة الذاتية المستندة إلى دمج أجهزة الاستشعار متعددة الوسائط التي تم إنشاؤها بناءً على بيانات الخريطة بدقة تبلغ مستوى السنتيمتر، مما يحسن بشكل كبير الإنتاج الضخم ويقلل من حجم حزمة الخريطة التي يعتمد عليها تحديد الموقع على جانب السيارة من خلال 97.5%، والموثوقية تصل إلى 99.9999%، مما يدعم بشكل كامل العملية الحالية واسعة النطاق للقيادة الذاتية الكاملة لـ Luobo Kuaipao، وتحقيق القيادة الذاتية بالكامل في مختلف السيناريوهات المعقدة والصعبة مثل تحت الجسور والطرق متعددة الطبقات والأنفاق.
5. آلية الذاكرة الشخصية لذكاء النماذج الكبيرة
تقترح تقنية الاختراع هذه بشكل مبتكر مجموعة شاملة من آليات الذاكرة، تغطي خمس وحدات لمعالجة الذاكرة وتخزينها وإدارتها وتشغيلها واستخدامها، مما يمنح النماذج الكبيرة قدرات ذاكرة مخصصة. تعتمد معالجة الذاكرة على آلية الحصين البشري لتحقيق فهم متعمق ومعالجة دقيقة لمعلومات المستخدم في جميع السيناريوهات؛ وتدعم إدارة الذاكرة الإضافات والحذف والتعديلات النشطة للمستخدمين والإضافات والحذف والتعديلات التلقائية للنظام، مما يضمن الحصول على معلومات حقيقية. تحديثات الوقت ودقة بنك الذاكرة، وتحفيز الذاكرة واستخدامها، ومساعدة النماذج الكبيرة على إنتاج استجابات أكثر مجسمة وشخصية من خلال الجيل التأملي للذكريات ذات الصلة. تم استخدام تقنية الاختراع هذه على نطاق واسع في سيناريوهات مثل مساعدي الذكاء الاصطناعي الأذكياء والبشر الرقميين.
6. نظام النمذجة البشرية الرقمية الواقعية للغاية والقيادة والتوليد يعتمد على النماذج الكبيرة
تقترح هذه التكنولوجيا المبتكرة مجموعة كاملة من حلول النمذجة البشرية الرقمية فائقة الواقعية والقيادة والتوليد. بالنسبة للأشخاص الرقميين الحقيقيين، قمنا بتطوير نماذج بورتريه تعتمد على البيانات، وقيادة متعددة الوسائط ونماذج إنشاء فيديو بورتريه كبيرة لتحقيق إنتاج محتوى بشري رقمي طبيعي وواقعي، ونحن ندعم حصريًا استنساخ الصور الحية في مشاهد الحركة والتغطية واسعة النطاق، و تم تنفيذ أول غرفة بث مباشر تعمل بالذكاء الاصطناعي لكامل الجسم. بالنسبة للبشر الرقميين ثلاثي الأبعاد الواقعيين للغاية، قمنا بتطوير تقنيات الترحيل المشروط والتعاون متعدد الوكلاء استنادًا إلى نموذج Wenxin الكبير، مما يحقق إنتاجًا دقيقًا لصور بشرية رقمية فائقة الواقعية ومحتوى تشغيليًا يمكن مقارنته بالأفلام والتلفزيون الرائجة و ألعاب 3 أ. لقد تم استخدام تقنية الاختراع الحالي على نطاق واسع في العديد من المنتجات البشرية الرقمية ثلاثية الأبعاد مثل البث المباشر البشري الرقمي وإنتاج الفيديو والأجسام الذكية.
7. نظام الاسترجاع التجاري التوليدي المعتمد على النماذج الكبيرة
لقد غيرت تقنية الاختراع هذه عملية "فرز استدعاء الفهرس" التقليدية، وتسوية مسار النظام، وتقليل فقدان المعلومات، وترميز معلومات الأعمال إلى معلمات نموذجية من خلال بناء مهام تعلم الفهرس لتحقيق "النموذج كفهرس" والاستفادة من قوة البيانات الكبيرة. فهم القدرات والاستدلال، وتحقيق "التوليد والاسترجاع"، النموذج الجديد يحسن بشكل كبير كفاءة توجيه النظام بنسبة 120٪. كان المشروع المتضمن في هذا الاختراع هو الأول الذي تم تنفيذه في الصناعة، حيث حقق تطبيقًا صناعيًا واسع النطاق، وتم دمج النموذج التوليدي الكبير مع سيناريوهات البحث التجاري لتحقيق ابتكارات تكنولوجية متعددة زادت الجودة الإبداعية بمقدار 37 مرة بنسبة 92%، وتم تحقيق فوائد تجارية كبيرة وتأثير فني واسع النطاق.
8. تقنية دولاب الموازنة ذات البيانات الكبيرة
تحدد هذه التقنية المبتكرة تلقائيًا عيوب النموذج وتقوم بتجميع بيانات التدريب المتنوعة وعالية الجودة بكفاءة من خلال دمج المعلومات من مصادر ونماذج متعددة مثل تعليقات المستخدم وملاحظات التنفيذ وملاحظات الإشراف الذاتي. وفي الوقت نفسه، تعمل طريقة التعلم المعزز جنبًا إلى جنب مع ردود الفعل متعددة المصادر على تحسين تأثير تدريب النموذج بشكل كبير. تقوم هذه التقنية المبتكرة ببناء دولاب الموازنة للبيانات الذي يمكنه تحسين نفسه بشكل مستمر، واختراق عنق الزجاجة في النماذج الكبيرة بشكل فعال، وتقليل تكاليف الحصول على البيانات، وتحسين القدرة على التكيف وقوة النماذج الكبيرة، وتحسين أداء النموذج في سيناريوهات المهام المختلفة التطور المستمر للنماذج الكبيرة.
9. تكنولوجيا الاستدلال الفعال للنموذج الكبير
تقنية الاستدلال الفعالة التي تقترحها تقنية الاختراع هذه، تعتمد طبقة النموذج الأساسية على Flying Paddle Framework. في اتجاه بنية الاستدلال، تستمر في الابتكار في اتجاه PrefixCaching وLookahead وPagedAttention وفصل PD وما إلى ذلك. ويجمع بكفاءة بين التقنيات المختلفة لتحسين إنتاجية النموذج وأدائه بشكل كبير. فيما يتعلق بضغط النماذج الكبيرة، تتبنى الشركة تقنية تكميم النماذج الكبيرة بدون فقدان البيانات وتقوم بتنشيط أساليب مثل تجانس التجزئة التكيفي وإعادة ترتيب ربط الوزن، وهي الأولى في الصناعة التي تحقق ضغطًا فعالاً بدون فقدان لنماذج كبيرة تبلغ عشرات المليارات والمئات من النماذج المليارات. يدعم هذا الاختراع مجموعة متنوعة من أساليب ضغط النماذج الكبيرة وتسريع الاستدلال، وقد تم استخدامه في الأعمال الأساسية مثل منصة النماذج الكبيرة Baidu Intelligent Cloud Qianfan لتقليل استهلاك موارد استدلال النماذج، وتوفير تكاليف نشر النماذج الكبيرة بأكثر من 50%، و تحسين أداء النموذج وإنتاجية النموذج بنسبة 3-5 مرات.
10. نظام توليد الاسترجاع مدفوعًا بملاحظات بيانات المستخدم
يمكن لنظام توليد الاسترجاع الذي تقترحه هذه التكنولوجيا المبتكرة أن يجمع بين إشارات ردود فعل سلوك المستخدم لتحقيق التعزيز الذاتي السريع. مواءمة تفضيلات المستخدم مباشرة من خلال نمذجة الرضا والتعلم المعزز، واستخدام تعليقات المستخدم لتحفيز التفكير السريع للنظام، وحل مشكلات انخفاض كفاءة تعليقات الخبراء وصعوبة نمذجة تفضيلات المستخدم في تطبيقات البيانات التقليدية. وقد غطى نظام توليد الاسترجاع القائم على هذا الإطار 18% من حركة البحث ويستخدم على نطاق واسع في النصوص والفيديو والصور وسيناريوهات البحث الأخرى. إن الخصائص واسعة النطاق والقابلة لإعادة التدوير لتعليقات المستخدمين المتعددة تمكن النظام من التكيف بسرعة مع التغيرات في البيانات والمنتجات والبيئة، وتساعد النظام تلقائيًا على البحث عن التحسين، وتسريع تطور النظام إلى حالة مثالية القدرة التنافسية في السوق.