هل عصر تطبيقات الذكاء الاصطناعي وصل بالفعل؟
موضوع مؤتمر بايدو العالمي لهذا العام هو "التطبيقات قادمة" - اعتبارًا من أوائل نوفمبر، تجاوز متوسط المكالمات اليومية لنموذج Baidu Wenxin الضخم 1.5 مليار، بزيادة قدرها حوالي 30 مرة مقارنة بـ 50 مليون مرة تم الكشف عنها لأول مرة سنويًا منذ. وقال روبن لي: "يمثل منحنى النمو الحاد هذا انفجارًا في تطبيقات النماذج الكبيرة في الصين في العامين الماضيين".
وباعتباره الشكل الأكثر شيوعًا لتطبيقات الذكاء الاصطناعي، فإن العملاء الأذكياء على وشك الوصول إلى نقطة الانهيار، وأكد روبن لي، "سيصبح ناقلًا جديدًا للمحتوى والمعلومات والخدمات في العصر الأصلي للذكاء الاصطناعي".
وذلك لأنه "من ناحية، فإن الحد الأدنى لإنشاء الوكيل منخفض بما فيه الكفاية؛ ومن ناحية أخرى، فإن سقف الوكيل مرتفع بما يكفي لإنشاء تطبيقات قوية جدًا ويمكن أيضًا أن يؤدي التعاون بين العديد من الوكلاء إلى حل مشكلات أكثر تعقيدًا ." سؤال."
قام Robin Li بعرض 4 أنواع مختلفة من الوكلاء في الاجتماع، بما في ذلك وكلاء الشركة ووكلاء الأدوار ووكلاء الأدوات ووكلاء الصناعة. من بينها، من المرجح أن تحل الاستخبارات الرسمية للشركة محل الموقع الرسمي وتصبح الواجهة الأكثر مباشرة للمستهلكين.
"إن الوكلاء الشبيهين بالشركة يعادلون المواقع الإلكترونية الرسمية للشركة في عصر الذكاء الاصطناعي. يتمتع الوكلاء الشبيهون بالشركة بجميع الإمكانيات التي تتمتع بها المواقع الرسمية التقليدية، مثل مقدمات الشركة وصور المنتجات وعروض المعلمات ومواقع المتاجر غير المتصلة بالإنترنت وما إلى ذلك. ولكن لا تتمتع مواقع الويب التقليدية بالقدرة على التوصية بشكل استباقي، كما أن الاستجابة في الوقت المناسب وقدرات الخدمة الفردية متوفرة أيضًا في الوكيل الذكي للشركة.
أصدر Robin Li أيضًا الأداة الخالية من التعليمات البرمجية "Miaida" - وهو برنامج يتكون من نماذج كبيرة ووكلاء يمكنهم تحقيق أي فكرة دون كتابة تعليمات برمجية، بما في ذلك البرمجة الخالية من التعليمات البرمجية والتعاون متعدد الوكلاء والاتصال على نطاق واسع بمختلف هذه الأداة و القدرات الأخرى هي "أداة التعاون المتعددة الوكلاء الأكثر تعقيدًا في تاريخ البشرية حتى الآن."
بمساعدة "Miaoda"، يمكن للمستخدمين إكمال بناء النظام بأكمله من خلال تفاعل اللغة الطبيعية، ويمكنهم أيضًا تنفيذ تطبيقات مختلفة في أي سيناريو. مع تحسين قدرات النموذج الأساسي وتطوير القدرات التقنية الخاصة بـ Miaoda، يمكن القيام بالمزيد يمكن القيام به في المستقبل، بأشياء أكثر تعقيدًا، "وهذا يعني أنك لا تحتاج إلى تعيين مديري المشاريع والمصممين والمطورين والمختبرين وما إلى ذلك، يمكنك توجيه وكلاء متعددين لإكمال المهام بشكل تعاوني." فريق.
وعلى حد تعبير روبن لي، فإننا مع ميودا سوف نستهل "عصراً حيث يمكنك كسب المال فقط من خلال الاعتماد على الأفكار".
بعد إعادة تصنيف أعمال الجانب C لـ Baidu Netdisk إلى Mobile Ecosystem Group (MEG) في سبتمبر وتم الاستيلاء عليها من قبل Wang Ying، نائب رئيس Baidu ورئيس مكتبة Baidu وBaidu Netdisk، في هذا المؤتمر العالمي، Baidu قرص الشبكة وتم دمج المكتبة بشكل أكبر.
شارك وانغ ينغ بعض التغييرات الجديدة التي أجرتها بايدو في إنتاج المحتوى واستهلاكه في المؤتمر. وذكرت أن إنشاء المحتوى واستهلاكه حاليًا يواجه العديد من التحديات، مثل الأدوات المعقدة ودورات الإنتاج الطويلة وانخفاض كفاءة الاستهلاك. ولتحقيق هذه الغاية، قدمت Baidu Wenku وNetdisk تقنية الذكاء الاصطناعي لكسر قيود الأدوات وحدود الوسائط وتحقيق تجربة محتوى أكثر حرية وكفاءة.
لقد أدى إنشاء Baidu Wenku الذكي لـ PPT، وإنشاء ورق الذكاء الاصطناعي، وإنتاج الكتب المصورة بالذكاء الاصطناعي، وإمكانيات البحث بالذكاء الاصطناعي، وتوليد الروايات والقصص المصورة بالذكاء الاصطناعي إلى تحسين كفاءة وجودة إنتاج المحتوى بشكل كبير في نفس الوقت، من حيث استهلاك المحتوى، تم إطلاق Baidu Netdisk أدوات بسيطة مثل المسح الضوئي والإملاء البسيط وتلخيص الفيديو بالذكاء الاصطناعي تسهل بشكل كبير على المستخدمين معالجة المعلومات وفهمها.
على وجه التحديد، في السيناريوهات المكتبية، يوفر Baidu Wenku وظائف PPT الذكية والبحث وإعداد التقارير الذكية، في حين أن Baidu Netdisk لديه وظائف مثل ملاحظات الاستماع البسيطة؛ في سيناريوهات التعلم، يمكن للمستخدمين استخدام كتب الرسم الذكية من Baidu Wenku والبحث عن الصور من حيث وظيفة الأسئلة، يوفر Baidu Netdisk أدوات تعليمية مساعدة مثل تفسير الفيديو ومفردات Panpan فيما يتعلق بالترفيه، ويوفر Baidu Wenku الروايات الذكية والرسوم الهزلية الذكية، ويحتوي Baidu Netdisk على وظائف مثل تحرير الصور باستخدام الذكاء الاصطناعي. يعمل التكامل بين Baidu Wenku وNetdisk على توسيع سيناريوهات تطبيق المستخدمين، وتحقيق ذكاء المحتوى وتنوعه، وتعزيز تجربة المستخدم بشكل أكبر.
وظيفة قماش مجانية|مصدر الصورة: بايدو
بالإضافة إلى ذلك، أطلقت Baidu Wenku وNetdisk معًا نظام تشغيل محتوى جديدًا Free Canvas. يمكن لهذا النظام أن يساعد المستخدمين على إكمال جميع المهام بدءًا من البحث عن المعلومات وحتى التحرير والتوليد والمشاركة. فهو لا يدعم الإدخال والإخراج الكامل التنسيق بطرق متعددة فحسب، بل يتيح أيضًا استخدام المحتوى على مستوى العنصر، مما يؤدي إلى إثراء درجة الإنشاء والمشاركة حرية.
وبكلمات روبن لي، "إن اللوحة القماشية المجانية عبارة عن سبورة بيضاء عالمية يباركها نموذج Wenxin الكبير متعدد الوسائط." لا تُظهر هذه الابتكارات الإمكانات الهائلة لتكنولوجيا الذكاء الاصطناعي في مجال المحتوى فحسب، بل تبشر أيضًا بمزيد من الاحتمالات لإنتاج المحتوى واستهلاكه في المستقبل.
وفي المؤتمر، شارك شين دو، نائب الرئيس التنفيذي لمجموعة بايدو ورئيس مجموعة بايدو إنتليجنت كلاود للأعمال، أحدث التقدم الذي حققته بايدو إنتليجنت كلاود في النماذج الكبيرة وتطبيقات الذكاء الاصطناعي الأصلية. وقال شن دو إن التكنولوجيا النموذجية الكبيرة تنتقل من التغيير التكنولوجي إلى التغيير الصناعي، وتعيد تعريف الطريقة التي يتفاعل بها الناس مع العالم الرقمي والعالم المادي، وتصبح عنصرا أساسيا للمؤسسات لتعزيز قدرتها التنافسية.
ركز Shen Dou على منصة Qianfan، وهي عبارة عن منصة لضبط النماذج الكبيرة وتطوير التطبيقات، وهي توفر سلسلة أدوات غنية وتقلل بشكل كبير من عتبة تطوير تطبيقات الذكاء الاصطناعي الأصلية. لا تلبي منصة Qianfan متطلبات التطبيقات على مستوى المؤسسة عالية التخصيص وواسعة النطاق وعالية التوفر والأمان فحسب، بل تصدر أيضًا وكلاء سير العمل. يعمل هذا الابتكار على تعزيز قدرات فهم النية والتعميم للنماذج الكبيرة لتحويل مسارات العمل المعقدة إلى عوامل مرنة، مما يؤدي إلى تحسين كفاءة المؤسسة بشكل كبير. على سبيل المثال، استخدمت شركة China Pacific Insurance منصة Qianfan لإنشاء وكيل "مبيعات الميداليات الذهبية"، مما أدى إلى تحسين كفاءة الخدمة وتجربة المستخدم لتجديد التأمين على السيارات بشكل كبير.
Baidu Smart Cloud Qianfan|مصدر الصورة: Baidu
بالإضافة إلى ذلك، توفر منصة Baige خدمات حوسبة كبيرة ذات صلة بالنماذج تتسم بالكفاءة، بدءًا من إنشاء المجموعات وحتى التدريب على النماذج والاستدلال، مما يضمن أداءً مستقرًا وسريعًا للغاية. تعمل المنصة على حل المشكلات الرئيسية في نشر المجموعات على نطاق واسع، وتدعم التشغيل الفعال، وتلبي احتياجات الطاقة الحاسوبية لمختلف العملاء.
كما عرض Shen Dou حالات تطبيق منصة Qianfan في العديد من الصناعات، بما في ذلك طب التشخيص العام وتحسين دقة إنشاء السجلات الطبية من خلال نماذج الضبط الدقيق وتوفير وقت الأطباء؛ وتستكشف State Grid تطبيقات الذكاء الاصطناعي في صناعة الطاقة استنادًا إلى Wenxin الكبيرة نموذج وحقق نتائج ملحوظة. بالإضافة إلى ذلك، فإن ترقية منصة XiLing 4.0 تمكنها من إنشاء صور بشرية رقمية ثلاثية الأبعاد وإنتاج مقاطع فيديو احترافية، مما يقلل بشكل كبير من تكلفة إنتاج الفيديو القصير.
قامت شركة Baidu Intelligent Cloud ببناء بنية تحتية جديدة للذكاء الاصطناعي من خلال منصات Qianfan وBaige، مما يعزز تطبيق تكنولوجيا النماذج الكبيرة في مختلف الصناعات لتحسين مستوى الذكاء وكفاءة المؤسسات.
بالإضافة إلى التطبيقات، أصدرت بايدو أيضًا أجهزة هذه المرة. في الاجتماع، أصدر لي ينغ، نائب رئيس مجموعة بايدو والرئيس التنفيذي لشركة Xiaodu Technology، "أول نظارات ذكاء اصطناعي محلية مجهزة بنماذج صينية كبيرة" - نظارات Xiaodu AI.
نظارات Xiaodu AI|مصدر الصورة: Baidu
وقال لي ينغ إنه كجهاز منظور من منظور الشخص الأول للبشر، فإن قدرة نظارات الذكاء الاصطناعي على التقاط الرؤية والصوت والموقع وغيرها من المعلومات ستجلب امتدادًا غير مسبوق لحواس الناس، وستصبح أيضًا مدخلاً أكثر كفاءة وملاءمة للتواصل بين الإنسان والكمبيوتر. تفاعل.
استنادًا إلى نموذج Wenxin الكبير ونظام التشغيل DuerOS AI الأصلي، يمكن لـ Xiaodu AI تحقيق وظائف مثل التصوير من منظور الشخص الأول، وطرح الأسئلة أثناء المشي، والتعرف على السعرات الحرارية، وموسوعة التعرف على الأشياء، والترجمة الصوتية والمرئية، والمذكرات الذكية.
ومن خلال الجمع بين الجهاز والسحابة مع النماذج الكبيرة، يمكن استخدام نظارات Xiaodu AI بشكل مستقل أو إقرانها مع تطبيق. تحتوي النظارات على سطر واحد صيني مدمج ويمكنها الرد على أسئلة المستخدمين في الوقت الفعلي.
فيما يتعلق بالأجهزة، تم تجهيز نظارات Xiaodu AI بمجموعة من أربعة ميكروفونات للتعرف على الأصوات، وتصميم مكبر صوت مفتوح مانع للتسرب، وعدسة ذات زاوية واسعة للغاية بدقة 16 ميجابكسل، وخوارزمية مضادة للاهتزاز تعمل بالذكاء الاصطناعي؛ يتم شحنه خلال 30 دقيقة، مما يحقق 56 ساعة من وضع الاستعداد، وأكثر من 5 ساعات من الاستخدام المتواصل. ويزن الجهاز بأكمله 45 جرامًا فقط، وهو أقل من متوسط الصناعة البالغ 49 جرامًا.
ومن المتوقع أن يتم طرح نظارات Xiaodu AI للبيع في النصف الأول من العام المقبل. ولم يتم الإعلان عن السعر بعد، لكن موظفي الجناح قالوا إن السعر قد يصل إلى حوالي 2000 يوان.
وذكر روبن لي في اللقاء أن صناعة الذكاء الاصطناعي شهدت تغيرات كبيرة خلال الـ 24 شهرا الماضية، أبرزها أن النماذج الكبيرة قضت بشكل أساسي على ظاهرة الهلوسة. هذا التغيير يجعل الذكاء الاصطناعي من "الهراء الخطير" الأصلي إلى قابل للاستخدام وجدير بالثقة. النموذج الكبير هو في الأساس نموذج احتمالي، والمحتوى الذي يولده يحمل درجة معينة من عدم اليقين. ومع ذلك، من خلال استخدام تقنية RAG، تستطيع النماذج الكبيرة الاستفادة من المعلومات المستردة لتوجيه عملية إنشاء النص أو الإجابات، مما يؤدي إلى تحسين جودة المحتوى ودقته بشكل كبير.
من أجل حل مشكلة الهلوسة في توليد الصور، طورت بايدو تقنية في بداية هذا العام - iRAG (RAG المستندة إلى الصور)، وهي تقنية رسم فينسنت المعززة للاسترجاع. قبل ذلك، كانت الصور التي تم إنشاؤها بواسطة أنظمة الرسم البياني فينسنت التي تعتمد كليًا على نماذج لغوية كبيرة غالبًا ما تكون ذات جودة رديئة وحتى غير منطقية. تجمع تقنية iRAG من Baidu بين موارد الصور ذات المستوى المليار في Baidu Search وقدرات النموذج الأساسية القوية لإنشاء مجموعة متنوعة من الصور الواقعية للغاية. يتجاوز التأثير الإجمالي نظام Vincentian الأصلي بكثير ويزيل آثار إنشاء الآلة.
مع التحسن الكبير في إمكانية استخدام الصور المولدة بواسطة الذكاء الاصطناعي، تم أيضًا توسيع مساحة تطبيقها بشكل كبير. على سبيل المثال، في سيناريو الترويج للعلامة التجارية، ربما كان إنتاج مجموعة من الملصقات يكلف مئات الآلاف من اليوانات في الماضي، ولكن تكلفة الإنشاء الآن تساوي صفرًا تقريبًا. باختصار، تنعكس القيمة التجارية لـ iRAG في جوانب عدم الوهم والواقعية الفائقة والتكلفة المنخفضة والتوافر الفوري.
روبن لي في المؤتمر |. مصدر الصورة: بايدو
عندما تنضج قدرات النموذج الأساسية، ستأتي فترة مزدهرة لتطبيقات الذكاء الاصطناعي. إذًا، من أين تأتي تطبيقات الذكاء الاصطناعي وإلى أين ستذهب؟ هناك اتجاهان رئيسيان: أحدهما العملاء الأذكياء، والآخر التطبيقات الصناعية.
في المستقبل، ربما عندما تأتي فترة ازدهار تطبيقات الذكاء الاصطناعي حقًا، يمكن للذكاء الاصطناعي أن يحقق حقًا مهمته المتمثلة في "الفرص على مستوى الثورة الصناعية" وتحقيق توسع غير محدود في الإنتاجية للاقتصاد الاجتماعي.