متى ستظهر التطبيقات الفائقة؟ قد يكون هذا هو القلق الأكثر شيوعًا في صناعة الذكاء الاصطناعي خلال العام الماضي.
من السهل على الناس مقارنة الذكاء الاصطناعي بالإنترنت عبر الكمبيوتر الشخصي أو الإنترنت عبر الهاتف المحمول. وبعد سنوات قليلة من ظهور كليهما، أصبح لديهم تطبيقات فائقة الشعبية. ومع ذلك، فإن الذكاء الاصطناعي هو موجة تكنولوجية على مستوى الثورة الصناعية، إن زمن ظهور التطبيقات الفائقة للذكاء الاصطناعي يشبه وقت ظهور التطبيقات الفائقة بعد ظهور المحركات البخارية والكهرباء.
في عام 1776، تم تصنيع أول محرك بخاري ذو قيمة عملية وأصبح محركًا رئيسيًا عالميًا، مما قاد المجتمع البشري إلى "عصر البخار". ولم يتم استخدام المحركات البخارية على نطاق واسع في السكك الحديدية والشحن حتى القرن التاسع عشر القطاعات. وظهر القانون الثاني للديناميكا الحرارية بعد حوالي 100 عام؛ وكانت الثورة الكهربائية أيضًا بمثابة عملية تطورية، وكان اختراع الطاقة الكهربائية بمثابة بداية لذروة الثورة الصناعية الثانية، حيث ظهرت محطات توليد الطاقة، والأضواء الكهربائية، وخطوط التجميع، وما إلى ذلك، بعد الكهرباء شكل جديد للأعمال تطور تدريجيًا على مدى عقود.
ولذلك، فإن التطبيقات الفائقة في عصر الذكاء الاصطناعي ستظهر بالتأكيد، ولكن الوقت لم يحن بعد. في العام الماضي، كانت صناعة الذكاء الاصطناعي تتابع ما يسمى بـ "التطبيقات الفائقة"، والتي يبدو أنها حريصة بعض الشيء على تحقيق النجاح السريع.
وباعتبارها تقنية أساسية، فإن النماذج الكبيرة لا تنتج قيمة عملية بشكل مباشر. التطبيقات المختلفة المبنية على النموذج الأساسي الكبير هي معنى وجود النموذج. بالنسبة لمطوري تطبيقات الذكاء الاصطناعي ورواد الأعمال، من الواضح أن أفضل استراتيجية هي عدم الالتزام بالذكاء الاصطناعي العام أو "التطبيقات الفائقة"، ولكن اتخاذ خطوات صغيرة ومواصلة التكرار لإنشاء تطبيقات مفيدة للغاية.
مؤخرًا، في مؤتمر Baidu العالمي لعام 2024، أعلنت Baidu عن أحدث البيانات لنموذج Wenxin Big Model الخاص بها: قبل نصف عام، كانت استدعاءات واجهة برمجة التطبيقات اليومية لـ Wenxin Big Model 200 مليون، والآن تتجاوز 1.5 مليار، بزيادة قدرها 7.5 مرات في ستة أشهر فقط. وهذا ليس مجرد نموذج مصغر لانفجار تطبيقات الذكاء الاصطناعي في الصين، ولكنه يوضح أيضًا أن النماذج الكبيرة أنتجت بالفعل قيمة عملية للتطبيقات.
لفترة طويلة، كان من الصعب بيع نماذج محلية كبيرة للصناعات الأخرى، حيث قال أحد المطلعين على الصناعة ذات مرة لـ 36Kr: "سواء كان الأمر يتعلق بالأجهزة الذكية أو عملاء الذكاء الاصطناعي، فإن الطلب في الصناعة قوي جدًا، لكن القليل من الناس يرغبون حقًا في ذلك". ادفع الفاتورة لأن جيل الطرازات الكبيرة ضعيف للغاية وهناك أوهام في كل مكان. نظرًا لأن تجربة المستخدم الأولية للذكاء الاصطناعي التوليدي، محدودة بتطور القدرات المتعددة الوسائط، فهي أقرب إلى تجربة روبوت المحادثة البسيط. في البداية، يحتاج المستخدمون إلى متبنين مبكرين، ولكن نظرًا للخبرة المتواضعة، فإن الاحتفاظ بهم ضعيف.
في العام الماضي، كان التغيير الأكبر في النماذج الكبيرة هو أن "الوهم" قد تم التخلص منه بشكل أساسي وأصبحت النماذج قابلة للاستخدام. النموذج الكبير هو في الأساس نموذج احتمالي، عند إنشاء النص، يتم إنشاء النص التالي الأكثر احتمالاً تلقائيًا، مما يؤدي إلى تعرض الذكاء الاصطناعي غالبًا لـ "الهلوسة"، وهو ما يسمى "الهراء الخطير".
إذا كنت ترغب في تطوير تطبيقات تعتمد على نماذج كبيرة، فيجب عليك التخلص من "الأوهام". تستخدم صناعة الذكاء الاصطناعي عمومًا تقنية تحسين الاسترجاع (RAG، الجيل المعزز للاسترجاع) للقضاء بشكل أساسي على وهم النص الناتج عن النماذج الكبيرة، مما يجعل النماذج الكبيرة لها قيمة عملية. لكي تكون تقنية متعددة الوسائط عملية، تحتاج أيضًا إلى الدقة وإمكانية التحكم لتوسيع مساحة تطبيقات الذكاء الاصطناعي.
أصدرت بايدو iRAG (RAG القائم على الصور) الجديد في هذا المؤتمر العالمي - تكنولوجيا تعتمد على الصور المحسنة للاسترجاع. في بداية هذا العام، قررت بايدو حل مشكلة توليد "الأوهام" متعدد الوسائط، بحيث تتمكن صور فنسنت أيضًا من القضاء على الأوهام، وبالتالي تهبط في مجالات الأعمال السينمائية والتلفزيونية، والأعمال الكوميدية، والكتب المصورة، والملصقات الإنتاج وغيرها من المجالات.
على سبيل المثال، تعتمد صناعة السيارات بشكل كبير على التسويق وغالباً ما تتطلب عدداً كبيراً من التصوير الفوتوغرافي عالي الجودة، ومن أجل إنتاج صورة مثالية، فإنها تتطلب الكثير من الموارد البشرية والمالية والمادية. وباستخدام تقنية iRAG، تستطيع شركات السيارات الحصول على صورة فوتوغرافية ذات أداء بصري رائع وبتكلفة منخفضة جدًا وفي وقت أسرع. بل قد يكون أكثر مذهلة بصريا.
في الوقت الحاضر، ينقسم المسار الفني للذكاء الاصطناعي التوليدي بشكل أساسي إلى مدرستين، إحداهما هي مدرسة AGI، التي تحلم بتحقيق الذكاء الاصطناعي العام في غضون سنوات قليلة من خلال النماذج الكبيرة الأساسية، والأخرى هي المدرسة القائمة على التطبيقات، والتي تبدأ من احتياجات التطبيق واستخداماته، تطبيق نماذج التغذية الراجعة للابتكار.
على أساس البحث والتطوير المستمر للنماذج الأساسية واسعة النطاق، تركز بايدو بشكل أكبر على التطوير القائم على التطبيقات. ومن المفهوم أن iRAG يُستخدم لأن التطبيقات تحتاج إلى إنشاء صور دقيقة، على سبيل المثال، لا يمكن تشويه شعار الشركة أو تشويه الألوان، الأمر الذي يتطلب إمكانات دقيقة متعددة الوسائط. وبعد ما يقرب من عام من العمل الشاق، أصبحت هذه التكنولوجيا عملية. يمكن أيضًا أن يعود تقدم التطبيق إلى البحث والتطوير للنموذج نفسه.
بعد عامين، يمر الذكاء الاصطناعي التوليدي بفترة حرجة من تغيير المسار. كشفت 36Kr سابقًا أن شركتين محليتين ناشئتين في مجال الذكاء الاصطناعي أوقفتا التدريب المسبق للنماذج الكبيرة في اليومين الماضيين، وقد اشتد النقاش في الصناعة حول ما إذا كان قانون التوسع قد وصل إلى "تناقص العوائد على الاستثمار".
في الواقع، على نطاق عالمي، بدأت التغييرات بالفعل. لقد تنحى عمالقة التكنولوجيا العالمية مثل OpenAI، وMicrosoft، وGoogle على التوالي عن مناصبهم ونشروا عملاء أذكياء. في منتصف شهر سبتمبر، أعلن نعوم براون، الباحث في OpenAI، على وسائل التواصل الاجتماعي أنه يقوم بتعيين مهندسي تعلم الآلة لفريق البحث الجديد متعدد الوكلاء. أعلن الرئيس التنفيذي لشركة Microsoft ورئيس مجلس الإدارة ناديلا شخصيًا عن التقدم الجديد الذي أحرزه الذكاء الاصطناعي الخاص به، وأطلق 10 عملاء استخبارات أعمال جدد دفعة واحدة، وشكل مجموعة لأول مرة. وفي الوقت نفسه تقريبًا، كانت هناك أخبار تفيد بأن Google ستطلق أيضًا وكيلًا ذكيًا. وسرعان ما سربت Google "بطريق الخطأ" "نسخة معاينة داخلية" لأحدث نتائج تطوير الذكاء الاصطناعي جارفيس، وهو ذكاء اصطناعي من نوع الوكيل يمكنه القيام بذلك. تصفح الإنترنت وابحث بشكل مستقل عن المعلومات.
تقود بايدو اتجاه الوكيل الذكي في الصين. في حدث مؤتمر بايدو العالمي هذا، أصبح العميل الذكي هو بطل الرواية. تركز بايدو على أربعة أنواع من الوكلاء: نوع الشركة، ونوع الدور، ونوع الأداة، ونوع الصناعة.
على سبيل المثال، الوكيل الشبيه بالأداة "Free Canvas": استنادًا إلى تراكم أعمال المكتبات على المدى الطويل لشركة Baidu في السنوات الأولى، وتم فرضه على تكنولوجيا الذكاء الاصطناعي التوليدي، فقد حقق قفزة كبيرة في الإبداع.
في السنوات الأولى، كانت حاجة الناس لاستخدام المكتبات هي العثور على وثائق جاهزة. ومع ذلك، عندما ظهرت تكنولوجيا الذكاء الاصطناعي التوليدي، اكتشفت بايدو أن الحاجة الأساسية للأشخاص ليست العثور على مستند جاهز، بل إنشاء محتوى أكثر ملاءمة لهم.
ومن أجل تلبية هذه الاحتياجات، بدأت بايدو في التفكير في كيفية تمكين الأشخاص من الإبداع بشكل أفضل بناءً على المستندات الجاهزة، أو بدون أساس مادي، باتباع هذا المسار، تم إعادة بناء أقدم مكتبة بايدو. في وقت لاحق، أصدرت بايدو منتجًا مستقلاً، Orange Pian، والذي يمكنه إنشاء مقالات طويلة بنقرة واحدة. ويعتمد ميلاد Free Canvas أيضًا على هذا المنطق، مما يسمح للناس "بإيصال أفكارك بطريقة أكثر سهولة". للتعبير عن أفكارك الداخلية بشكل أكثر سهولة ودقة.
يعتقد روبن لي، مؤسس بايدو، أن "الوكلاء هم الشكل الأكثر شيوعا لتطبيقات الذكاء الاصطناعي وهم على وشك الدخول في نقطة الانفجار". الحساب في عصر الهاتف المحمول. الفرق هو أن الوكيل يشبه الإنسان أكثر، وأكثر ذكاءً، ويشبه المبيعات وخدمة العملاء والمساعد. قد يصبح الوكلاء الناقل الجديد للمحتوى والمعلومات والخدمات في عصر الذكاء الاصطناعي الأصلي.
كما أعرب سام ألتمان، الرئيس التنفيذي لشركة OpenAI، عن إمكانية اللجوء إلى مطوري وكلاء الذكاء الاصطناعي عند الإجابة على سؤال على Reddit الشهر الماضي. "سيكون لدينا نماذج أفضل وأفضل، لكنني أعتقد أن الإنجاز الكبير التالي سيكون عملاء الذكاء الاصطناعي." قال Jen-Hsun Huang من NVIDIA أيضًا أن NVIDIA سيكون لديها 100 مليون عميل ذكي في المستقبل.
إن سمة الوكيل الذكي هي أن الحد الأدنى منخفض بما فيه الكفاية والسقف مرتفع بما فيه الكفاية، ويمكن أن ينمو ليصبح شركة قوية جدًا، تمامًا مثل Google وMeta، اللتين أسسهما طلاب الجامعات منذ سنوات عديدة، وقد تطوروا ليصبحوا كذلك أقوى عمالقة التكنولوجيا في العالم . إلى حد ما، فإن عدم بناء وكيل ذكي الآن يشبه عدم إنشاء موقع ويب قبل عشرين عامًا أو تطبيق قبل عشر سنوات.
هناك عدد قليل من الشركات الصينية التي لعبت دورًا مهمًا في نقاط المواهب والموارد والتكنولوجيا لتطوير الذكاء الاصطناعي العالمي مثل بايدو. وخلف ذلك، لا يمكن فصله عن إيمان المؤسس وإصراره على الذكاء الاصطناعي. في الصناعة، لدى روبن لي مقولة كلاسيكية: "عندما يكون لدي يوان واحد، سأستثمر في التكنولوجيا؛ وعندما يكون لدي 100 مليون، سأستثمر في التكنولوجيا؛ وعندما يكون لدي 10 مليارات، سأستمر في الاستثمار في التكنولوجيا". .
يمكن إرجاع عمل بايدو في مجال الذكاء الاصطناعي إلى المزاد الشهير الذي أقيم قبل أكثر من عشر سنوات. في أحد أيام شهر ديسمبر عام 2012، أقيم مزاد سري عند سفح جبل للتزلج جنوب بحيرة تاهو في ولاية نيفادا بالولايات المتحدة الأمريكية. كانت الأصول التي تم بيعها بالمزاد في الواقع "ثلاثة أشخاص" - البروفيسور جيفري إي. هينتون، "الأب الروحي للذكاء الاصطناعي" واثنين من طلابه.
وكثيراً ما رفع ممثلو بايدو، وجوجل، ومايكروسوفت، وديب مايند عروضهم، وارتفع العرض إلى 44 مليون دولار أمريكي. عند هذه النقطة، لم يتبق سوى بايدو وجوجل من بين المشاركين. وعلى الرغم من أن بايدو شاركت في المزاد دون حد أعلى، إلا أنها لم تنجح في النهاية.
وهذا أيضًا جعل روبن لي يدرك أنه يجب عليه تطوير التعلم العميق والقيادة الذاتية وغيرها من التقنيات بمفرده. بعد ذلك، أسس معهد بايدو الأمريكي للأبحاث وبدأ في توظيف المواهب العالمية بقوة، ومنذ ذلك الحين، نجح في جذب المواهب بما في ذلك إنج إندا ، داريو أمودي، وما إلى ذلك. انضم أفضل المواهب من جميع أنحاء العالم.
في السنوات العشر التالية، بدأت بايدو فترة البحث الذاتي الكاملة في تكنولوجيا الذكاء الاصطناعي، من الرقائق والأطر والنماذج إلى طبقات التطبيق، وهزمتها واحدة تلو الأخرى. أصدرت بايدو على التوالي منصة Apollo المفتوحة للقيادة الذاتية، وإطار التعلم العميق PaddlePaddle مفتوح المصدر، وحتى أصدرت الإصدار 1.0 من نموذج Wenxin الكبير في أوائل عام 2019.
ومع ذلك، حتى ولادة ChatGPT، لم يجد تطبيق تكنولوجيا الذكاء الاصطناعي نقطة تحول، وقد اعتبرتها الصناعة بمثابة حفرة لا نهاية لها من المال، ولا يزال تطبيقها العملي بعيدًا.
المثابرة دائما تؤتي ثمارها. حدث الانعكاس في مارس 2023. استنادًا إلى الإصدار 3.0 من نموذج Wenxin الكبير، كانت Baidu أول شركة في العالم تطلق منتجًا يقيس ChatGPT، Wenxin Yiyan. وعند هذه النقطة، أتت عشر سنوات من الاستثمار الصامت بثمارها أخيراً.
بدءًا من النصف الثاني من عام 2023، مع ضمان استمرار النموذج الأساسي في الريادة، أدركت بايدو فجأة أن المنافسة المتجانسة للنماذج الكبيرة تسببت في إهدار هائل للموارد، وقد دعا روبن لي علنًا عدة مرات إلى "تدوير التطبيقات، وليس". "، وطلبت داخل الشركة أن تكون الشركة الأولى في إعادة بناء جميع المنتجات باستخدام النماذج الكبيرة. في المؤتمر العالمي لعام 2023، أظهرت بايدو للعالم الخارجي نتائج إعادة بناء التطبيقات المهمة مثل البحث والخرائط وأقراص الشبكة. وفي المؤتمر العالمي لهذا العام، تم تحديد موضوع بايدو مباشرة على أنه "التطبيقات قادمة"، مما يسمح للعالم الخارجي بذلك. انظر النموذج واسع النطاق في القيمة الهائلة التي تم إنشاؤها في مجالات الأجسام الذكية والتطبيقات الصناعية وغيرها من المجالات.
إذا نظرنا إلى الماضي، فليس من الصعب أن نرى أن بايدو قد اتخذت الخيارات الصحيحة في كل نقطة مهمة في تطوير الذكاء الاصطناعي العالمي في العقد الماضي. في المستقبل على المدى الطويل، يأمل روبن لي أن يتم استخدام الذكاء الاصطناعي حقًا من قبل كل شخص عادي، حتى يتمكن الجميع من الحصول على قدرة المبرمج.
في مؤتمر Baidu العالمي، أصدر Robin Li أيضًا One More Thing - Miaida، وهو برنامج لا يحتوي على برمجة برمجية، وتعاون متعدد الوكلاء، واستدعاء متعدد الأدوات.
تختلف Miaida كثيرًا عن أي أدوات مساعدة سابقة لإنشاء التعليمات البرمجية من حيث أنها لا تتطلب من المستخدمين فهم التعليمات البرمجية. في المقابل، كانت أدوات الذكاء الاصطناعي السابقة، كأدوات إنتاجية، تدور حول تعزيز قدرات النخب في قمة الهرم، على سبيل المثال، في وادي السليكون، يعد توليد التعليمات البرمجية المساعدة مهمًا للغاية نظرًا لوجود نقص في المهندسين في الولايات المتحدة. كما أن أجور المهندسين بالساعة باهظة الثمن أيضًا. ويمكن للأدوات المساعدة أن تحسن الكفاءة وتجعل من هم في قمة الهرم أكثر قوة.
ولكن الذكاء الاصطناعي ينبغي أن يكون شيئا يمكن للجميع الاستفادة منه، بدلا من أن يكون براءة اختراع يستخدمها عدد قليل من الناس.
ومع التحسن التدريجي لقدرات النماذج والوكلاء الأساسيين، تدمج بايدو هذه القدرات التقنية للسماح للأشخاص العاديين الحقيقيين، الذين لا يستطيعون فهم سطر من التعليمات البرمجية، بالحصول على قدرات المبرمجين.
فقط تخيل، عندما يمتلك مئات الملايين أو أكثر من مليار شخص هذه القدرة، فإنها ستتوافق مع مساحة سوقية ضخمة، وخاصة انفجار الإبداع، الذي لا مثيل له من قبل تقنيات مثل أدوات توليد الأكواد المساعدة. وتأمل بايدو أن يتمتع كل شخص عادي بقدرات أولئك الموجودين في أعلى الهرم، ومن الطبيعي أن تكون أهميتها أكثر عمقًا.
وقال روبن لي خلال المؤتمر: "إن بايدو لن تطلق "تطبيقًا فائقًا"، ولكنها ستستمر في مساعدة المزيد من الأشخاص والمزيد من الشركات على إنشاء ملايين التطبيقات "المفيدة للغاية"."
فقط تخيل أنه في عصر الذكاء الاصطناعي، يمكن لعدد متزايد من الأشخاص تعلم كيفية إنشاء منتجات وخدمات جديدة، واستخدام برمجة اللغة الطبيعية، وهو إجراء إبداعي ومنخفض العتبة، لتحقيق بعض الأفكار الجامحة وإنشاء عدد لا يحصى من المنتجات القيمة. هذه هي الشمولية الحقيقية للتكنولوجيا.