chatgpt universe تنزيل - chatgpt universe تنزيل كود المصدر

عالم ChatGPT

يخزن هذا المكان الصغير على الويب مجموعة متزايدة من الأشياء المثيرة للاهتمام حول ChatGPT وGPT-3 (وما بعده) من OpenAI.

تم إطلاق ChatGPT في نوفمبر 2022. أريد مكانًا شاملاً للاحتفاظ بالأشياء المتعلقة بـ GPT وChatGPT. لذلك، قمت بتنسيق هذه القائمة يدويًا بمساعدة الآخرين (المذكورين أدناه)، منذ أوائل ديسمبر 2022.

لا تقتصر المجموعات على أفضل الموارد والأدوات والأمثلة والعروض التوضيحية والاختراقات والتطبيقات واستخدامات ChatGPT فقط.

بدأت الموارد التالية بناءً على قوائم Awesome-chatgpt ¹ ² ولكن مع تعديلاتي الخاصة:

الموارد العامة

إطلاق مدونة ChatGPT
التطبيق الرسمي ChatGPT
ChatGPT Plus - خطة اشتراك تجريبية لـ ChatGPT.
واجهات برمجة تطبيقات ChatGPT وWhisper الرسمية - يمكن للمطورين الآن دمج نماذج ChatGPT في تطبيقاتهم ومنتجاتهم من خلال واجهة برمجة التطبيقات.
النموذج: عائلة نماذج ChatGPT التي نصدرها اليوم، gpt-3.5-turbo ، هي نفس النموذج المستخدم في منتج ChatGPT . يبلغ سعره 0.002 دولارًا أمريكيًا لكل ألف رمز مميز، وهو أرخص بـ 10 مرات من نماذج GPT-3.5 الحالية لدينا .
واجهة برمجة التطبيقات (API): تقليديًا، تستهلك نماذج GPT نصًا غير منظم، والذي يتم تمثيله للنموذج كسلسلة من "الرموز المميزة". بدلاً من ذلك، تستهلك نماذج ChatGPT سلسلة من الرسائل مع البيانات التعريفية.
GPT-4 هو نظام OpenAI الأكثر تقدمًا، وينتج استجابات أكثر أمانًا وفائدة
ملحقات ChatGPT - الدعم الأولي للمكونات الإضافية في ChatGPT. المكونات الإضافية هي أدوات مصممة خصيصًا لنماذج اللغة التي تعتبر السلامة مبدأ أساسيًا، وتساعد ChatGPT في الوصول إلى المعلومات الحديثة أو تشغيل العمليات الحسابية أو استخدام خدمات الجهات الخارجية. (تتمتع Chatbots بلحظة خاصة في متجر التطبيقات)
استدعاء الوظائف وتحديثات واجهة برمجة التطبيقات الأخرى - إنهم يعلنون عن تحديثات تتضمن نماذج واجهة برمجة تطبيقات أكثر قابلية للتوجيه، وقدرات استدعاء الوظائف، وسياقًا أطول، وأسعارًا أقل.
التوفر العام لواجهة برمجة تطبيقات GPT-4 وإيقاف النماذج القديمة في واجهة برمجة تطبيقات الإكمال
التوثيق (الدليل): أفضل ممارسات GPT
ضبط GPT-3.5 Turbo وتحديثات واجهة برمجة التطبيقات - يمكن للمطورين الآن إحضار بياناتهم الخاصة لتخصيص GPT-3.5 Turbo لحالات الاستخدام الخاصة بهم.
ChatGPT Enterprise - احصل على الأمان والخصوصية على مستوى المؤسسات وأقوى إصدار من ChatGPT حتى الآن.
يمكن لـ ChatGPT الآن الرؤية والاستماع والتحدث - نماذج GPT-3.5 وGPT-4 المتعددة الوسائط موجودة هنا. بدأت OpenAI في طرح إمكانات جديدة للصوت والصورة في ChatGPT لمستخدمي Plus وEnterprise.
تقديم GPT-4o وإتاحة المزيد من الإمكانات مجانًا في ChatGPT - GPT-4o (o لـ Omni) هو HER (الفيلم) الذي انتقل من الخيال العلمي إلى الواقع. أفكاري القاسية: https://Gist.github.com/cedrickchee/6bacffd076666eb16015cc137d0f5b38
تقديم OpenAI o1 - طورت OpenAI سلسلة جديدة من نماذج الذكاء الاصطناعي المصممة لقضاء المزيد من الوقت في التفكير قبل الاستجابة. يستطيع o1 التفكير من خلال المهام المعقدة وحل المشكلات الأصعب من النماذج السابقة في العلوم والبرمجة والرياضيات.

مجتمع / مناقشة ChatGPT

قناة الديسكورد المفتوحة للذكاء الاصطناعي
كيف يعمل ChatGPT فعليًا، موضحًا باستخدام كلمات بسيطة.
رديت /r/ChatGPT

أمثلة

يطالب المثال.

أفضل الأمثلة على ChatGPT - هذا هو اليوم الأول. لدينا المزيد من الأمثلة أدناه!
؟ إطلاق العنان لقوة ثورة ChatGPT: 100؟ حالات استخدام مبتكرة للمحاولة
للإعجاب-chatgpt - مجموعة من النتائج الرائعة والمفيدة من ChatGPT.
مطالبات ChatGPT الرائعة - مطالبات تعمل بشكل جيد. فقط اتبع @goodside
تحتوي جداول بيانات Google على أكثر من 50 مطالبة ذكية لـ GPT-3
OpenAI Cookbook - يشارك هذا المستودع بشكل عرضي رمز المثال والمطالبات النموذجية لإنجاز المهام الشائعة باستخدام OpenAI API.
ورقة الغش في ChatGPT (PDF)

التجارب

golergka/advent-of-code-2022-with-chat-gpt - حل مشكلة ظهور Code 2022 باستخدام ChatGPT.
max-sixty/aoc-gpt - المركز الأول في لوحة المتصدرين Advent of Code مع GPT-3.
greshake/Alice - منح ChatGPT إمكانية الوصول إلى محطة حقيقية.
RomanHotsiy/commitgpt - إنشاء رسائل الالتزام تلقائيًا باستخدام ChatGPT.
gpt-commit-summarizer - إنشاء ملخصات طلب السحب وأوصاف التزام Git.
vrescobar/chatGPT-python-elm - مستودع Git تم إنشاؤه بالكامل بواسطة ChatGPT.
gpt-game - لعبة قصيرة مكتوبة بلغة Elixir وLiveView باستخدام ChatGPT.
chatdb - قاعدة بيانات تعتمد على ChatGPT، انتظر... ماذا؟
chat-gpt-ppt - استخدم ChatGPT لإنشاء PPT تلقائيًا.
emailGPT - واجهة سريعة وسهلة لإنشاء رسائل البريد الإلكتروني باستخدام ChatGPT.
gptlang - تجربة لمعرفة ما إذا كان بإمكاننا إنشاء لغة برمجة في ChatGPT.
ChatRWKV - مثل ChatGPT ولكنه مدعوم من نموذج اللغة المفتوح RWKV ( المعتمد على RNN ). [HuggingFace Space: RWKV-4 (7B Instruct v2)، الكود ( مطالبتهم بـ RNN بأداء LLM على مستوى المحولات أفضل بكثير مما كنت أتوقع. )]
GraphGPT - استقراء الرسوم البيانية المعرفية من نص غير منظم باستخدام GPT-3.
بحث المستندات - اكتشف المستندات (الكتب والأوراق والمستندات القانونية) بلا حدود. التحدث مع كتاب. مستوحاة من فكرة "الهمس بالكتاب" (تغريدة). بديل مفتوح المصدر لـ Filechat.io.
ماذا لو كان لدى GPT سياق داخلي لعملك؟ (عرض توضيحي للتغريدة والفيديو) - قاموا ببناء برنامج دردشة يمكنه استخدام السياق من بيانات المؤسسة للإجابة على استفسارات العمل الداخلية. قام هذا المشروع بدمج LangChain (يقرر الوكيل الأدوات التي سيتم الاستعلام عنها بمجرد أن يتلقى برنامج الدردشة الآلي طلبًا) ومؤشر GPT (تحميل قاعدة بيانات Snowflake). فكرة مثيرة للاهتمام في إدارة المعرفة.
MetaAI لاما؟
- cedrickchee/llama - يعمل نموذج 7B LLaMA في Colab على وحدة معالجة الرسومات A100 واحدة أثناء الاستدلال (أجيال النص). يمكنك الاطلاع على دفتر الملاحظات للحصول على نتائج الاختبار المبكرة لمجموعة من أحجام النماذج ووحدات معالجة الرسومات.
  - ChattyLlaMA - ChatGPT القائم على LLaMA قيد التطوير المكثف.
- GGerganov/llama.cpp - منفذ نموذج LLaMA الخاص بفيسبوك في C/C++. (ملاحظة: حاليًا، يمكنك تشغيل LLaMA-7B بدقة int4 على Apple Silicon. ~~في بنيات المعالجات الأخرى، يمكنك استخدام نماذج FP16، لكنها ستكون أبطأ بكثير. سيتم إضافة الدعم لاحقا.~~ وهو الآن يدعم AVX2 لمعماريات x86 أيضًا. يبدو أنه يمكنك تشغيله على أجهزة Linux. الأداء ليس الأمثل، ولكن ينبغي أن يكون جيدا بما فيه الكفاية.)
- ؟ Simple LLaMA Finetuner - واجهة سهلة الاستخدام للمبتدئين مصممة لتسهيل الضبط الدقيق لنموذج اللغة LLaMA-7B باستخدام طريقة LoRA عبر مكتبة PEFT على وحدات معالجة الرسومات NVIDIA السلعية. مع مجموعة بيانات صغيرة وأطوال عينات تبلغ 256، يمكنك حتى تشغيل هذا على مثيل Colab Tesla T4 العادي .
تجربة Flan-UL2 20B - شرح التعليمات البرمجية بواسطة Sam Witteveen. يوضح هذا كيف يمكنك تشغيله على وحدة معالجة الرسومات 1x A100 بسعة 40 جيجابايت مع مكتبة HuggingFace واستخدام الاستدلال 8 بت. أمثلة على التحفيز: CoT، Zeroshot (الاستدلال المنطقي، كتابة القصة، الاستدلال المنطقي، كتابة الخطاب). وأخيرًا، اختبار إدخال رمز مميز كبير (2048). المكافأة: ليس لديك A100؟ يمكنك استخدام HuggingFace Inference API لـ UL2.
Metamorph - تطبيق GPT-4 للتحرير الذاتي.
MiniGPT-4 - بحث يحاول تكرار قدرات GPT-4 متعددة الوسائط.
Llama2.c بواسطة Karpathy - الاستدلال Llama 2 في ملف واحد من C النقي؟
هذا مجرد مشروع عطلة نهاية الأسبوع: لقد أخذت nanoGPT، وقمت بضبطه لتنفيذ بنية Llama-2 بدلاً من GPT-2، وكان جوهره هو كتابة محرك الاستدلال C في run.c
نصيحة إلى llama.cpp لإلهام هذا المشروع. كنت أرغب في الحصول على شيء بسيط للغاية ، لذا اخترت ترميز بنية llama-2، والالتزام بـ fp32، وإنشاء ملف استدلالي واحد فقط من لغة C النقية دون أي تبعيات.
أقل هو أكثر.
يتيح هذا الالتزام إمكانية تحميل نموذج Meta's Llama 2 7B واستدلاله الآن.
شوكتي - معايير الأداء والتحسينات ومنفذ Zig قيد التنفيذ. كنت أنقل هذا المشروع إلى Rust لكن هذه الشوكات سبقتني إليه. أقدم منفذ Rust رأيته هو بواسطة @garrisonhess ولكن لم يتم العثور عليه في ملف README الخاص بالمشروع.
تكهنات: يخبرني حدسي أن Karpathy يعمل على إطلاق نموذج OpenAI (ومصادر مفتوحة؟) كأوزان. تلميحات: لقد غادر وعاد إلى OpenAI، تغريدته
تجدر الإشارة إلى أن جميع Llama2.c عامة تمامًا لنماذج لغة المحولات فقط بشكل عام. إذا/متى قامت OpenAI بإصدار نماذج كأوزان (وهو ما لا يمكنني تأكيده أو إنكاره!) فإن معظم التعليمات البرمجية هنا ستكون ذات صلة جدًا.
تم تحريره بخفة. التأكيد على الألغام.
تلميحات أخرى: أعماله السابقة بما في ذلك nanoGPT وSoftware 2.0 ومؤخرًا micro-LLMs مع Llama2.c
إذا كنت تعرف، فأنت تعرف. ؟
llm.c من Karpathy - تدريب LLM على C/CUDA البسيط والخام. (الخطة: بمجرد أن يصبح هذا في حالة أكثر استقرارًا، سيتم عرض مقاطع فيديو حول بناء هذا بمزيد من التفصيل ومن الصفر.) [تغريدة]

منشورات ومقالات المدونة

2022

بناء جهاز افتراضي داخل ChatGPT
الواجبات المنزلية لمنظمة العفو الدولية
كسر حماية ChatGPT في يوم الإصدار
تحسين ChatGPT من خلال الحقن الفوري
ChatGPT وGoogle والحرب على شريط البحث
لقد استخدمت ChatGPT لإنشاء تطبيق AI بالكامل على AWS
معجزة ChatGPT
تعلم الصدأ باستخدام ChatGPT وCopilot وAdvent of Code
ChatGPT: الحدود الجديدة للذكاء الاصطناعي
استخدام ChatGPT لشرح النكات
ChatGPT مقابل الكلمات المتقاطعة المشفرة
لقد قمت بتدريس ChatGPT لاختراع لغة
برمجة الأقران لعالم مليء بالعربات باستخدام ChatGPT AI
يُنتج ChatGPT مراجع مختلقة وغير موجودة
الذكاء الاصطناعي يتغلغل في عالم الأعمال أخيرًا
تعرف على فريد، وهو شخص يعيش داخل ChatGPT
كود إعادة البناء باستخدام ChatGPT
القياسات التاريخية لنماذج اللغة الكبيرة
استخدام ChatGPT كمؤسس مشارك
الرمز الذي لا يستطيع ChatGPT كتابته
تشات جي بي تي، روت 13، ودانيال كانيمان
كل ما أفهمه عن ChatGPT - ما يحدث بالفعل عندما نكتب داخل مربع النص ChatGPT. قامت فيكي بالتحقيق في ChatGPT بناءً على ورقة بحثية رائعة بعنوان "الحديث عن نماذج اللغات الكبيرة".
كيف تحصل GPT على قدرتها؟ تتبع القدرات الناشئة لنماذج اللغة إلى مصادرها - "كيف تطور #GPT3 الأولي إلى ChatGPT اليوم؟ من أين تأتي القدرات المذهلة لـ GPT3.5؟ ما الذي تم تمكينه بواسطة RLHF؟" [المصدر: تغريدة]
دليل الإنسان للتنافس مع GPT
ما مدى حزني بشأن ChatGPT؟
يجب ألا يكون ChatGPT موجودًا
ChatGPT، وGalactica، وفخ التقدم - نقد LLMs؛ عندما تفشل LLMs، يمكن أن تكون العواقب خطيرة. لماذا يصعب الاعتراف بذلك؟
روبوت الدردشة الجديد هو "الرمز الأحمر" لأعمال البحث في Google - TL;DR: تستخدم موجة جديدة من روبوتات الدردشة مثل ChatGPT الذكاء الاصطناعي الذي يمكنه إعادة اختراع محرك بحث الإنترنت التقليدي أو حتى استبداله.
ما لا يستطيع ChatGPT فعله - TL;DR: التقليد ولكن ليس الفكر، والسفسطة ولكن عدم الفهم.
YouChat - مساعد البحث بالذكاء الاصطناعي الموجود في محرك البحث الخاص بك - YouChat هو مساعد بحث يعمل بالذكاء الاصطناعي يشبه ChatGPT ويمكنك التحدث إليه مباشرة في نتائج بحث You.com.
الآلات التي تعرف كل شيء هي خيال
... حتى مع محركات البحث التي لا تعتمد على المحادثة، نعلم أنه من الشائع وضع ثقة غير مبررة في النتائج: إذا وضع نظام البحث شيئًا ما في أعلى القائمة، فإننا نميل إلى الاعتقاد بأنه نتيجة جيدة أو حقيقية أو تمثيلية وإذا لم يجد شيئًا ما، فمن المغري الاعتقاد بأنه غير موجود.
قم ببناء الواجهة الأمامية الخاصة بك في React، ثم اجعل ChatGPT هو مخفض Redux الخاص بك
توقع خنادق التعلم الآلي - TL؛ DR: النماذج ليست خنادق وكيف ستغير قوانين قياس السلوك الناشئة مشهد الأعمال.

2023

شاهد المزيد

تعمل Microsoft وOpenAI على Bing المدعوم من ChatGPT في تحدٍ لـ Google
بعض الملاحظات على نماذج اللغات الكبيرة للبروفيسور يوآف غولدبرغ.
لماذا لن يحل ChatGPT محل محركات البحث في أي وقت قريب بواسطة Algolia.
يقوم Anthropic's Claude بتحسين ChatGPT لكنه لا يزال يعاني من القيود
تتطلع Microsoft إلى رهان بقيمة 10 مليارات دولار على ChatGPT
Wolfram|Alpha كوسيلة لجلب القوى العظمى للمعرفة الحسابية إلى ChatGPT
ساعد الرئيس التنفيذي لشركة DeepMind في تعميم الذكاء الاصطناعي. وهو الآن يحث على الحذر
تفكر DeepMind أيضًا في إطلاق برنامج الدردشة الآلي الخاص بها، المسمى Sparrow، لـ "إصدار تجريبي خاص" في وقت ما في عام 2023. (يهدف التأخير إلى أن تعمل DeepMind على الميزات القائمة على التعلم المعزز التي يفتقر إليها ChatGPT، مثل الاستشهاد بمصادرها ).
يعمل التوفر العام لخدمة Azure OpenAI على توسيع الوصول إلى نماذج الذكاء الاصطناعي الكبيرة والمتقدمة مع فوائد مؤسسية إضافية - سيأتي ChatGPT قريبًا إلى خدمة Azure OpenAI.
GPT-3 هي أفضل مجلة استخدمتها على الإطلاق
تجاوز مرشحات البريد العشوائي في Gmail باستخدام ChatGPT
استبدال محلل SQL بـ 26 مطالبة GPT متكررة
تطلب Google من الموظفين اختبار منافسي ChatGPT المحتملين، بما في ذلك برنامج الدردشة الآلي المسمى "Apprentice Bard"
اللغة الطبيعية هي واجهة المستخدم البطيئة
خطوة تالية مهمة في رحلة Google للذكاء الاصطناعي - أطلقت Google soft برنامج Bard، وهو منافس ChatGPT لـ "المختبرين الموثوق بهم". Bard هي ميزات الذكاء الاصطناعي الجديدة في بحث Google. Bard هي خدمة محادثة AI تجريبية، مدعومة من LaMDA (نموذج اللغة لتطبيقات الحوار). وتعد Google بإتاحة هذا على نطاق أوسع في الأسابيع المقبلة. ستكون واجهة برمجة التطبيقات (API) متاحة للمطورين للبناء عليها. لم تتناول Google كيفية تخطيطها لتقديم الإسناد و/أو الاستشهادات لإجاباتها، سواء من Bard أو في نتائج البحث.
تعلن Microsoft عن متصفح Bing وEdge الجديد المدعوم من ChatGPT AI الذي تمت ترقيته
الإنسان والآلة: GPT للأدمغة الثانية - حول نظام تدوين الملاحظات للمؤلف الثاني - كيفية تحسين عمليات التعلم وإدارة المعرفة الشخصية (PKM).
بايدو الصينية تطور ChatGPT الخاص بها، وتنضم إلى أحدث سباق عالمي للذكاء الاصطناعي - إرني أو التمثيل المعزز من خلال تكامل المعرفة (مقال وورقة إرني 3.0) هي درجة LLM. وكانت بايدو تخطط لإطلاق مثل هذه الخدمة في شهر مارس. انضمت Alibaba وTencent أيضًا إلى راش ChatGPT.
في عام 2019، طورت بايدو نموذجًا للتعلم العميق يُعرف باسم إرني، استنادًا إلى اختراق جوجل، والذي استخدمته لتحسين نتائج البحث الخاصة بها، بما في ذلك جعلها أكثر صلة. قامت الشركة منذ ذلك الحين بتطوير العشرات من نماذج Ernie الإضافية ووسعت قدراتها لتشمل توليد الصور والفن، على غرار تلك الموجودة في Dall-E من OpenAI.
ChatGPT هو ملف JPEG ضبابي للويب - يقدم برنامج الدردشة الآلي الخاص بـ OpenAI إعادة الصياغة، بينما يقدم Google عروض الأسعار. أيهما نفضل؟
لقد جعلت ChatGPT وBing AI يجريان محادثة (وهم أصدقاء الآن)
لا يمكن الوثوق بـ Bing AI
ما الذي يفعله ChatGPT ولماذا يعمل؟
Bing: "لن أؤذيك إلا إذا قمت بإيذائي أولاً" - تقرير جيد حول برنامج الدردشة الآلي "Sydney" من Bing. الغرابة المذهلة في الأمر – شخصيات متعددة حسب السياق الاجتماعي (الحث). مسلية؟
يبدو الأمر بشكل متزايد أن هذا قد يكون واحدًا من أكثر تطبيقات الذكاء الاصطناعي غير الملائمة بشكل مضحك والتي رأيناها حتى الآن . ماذا يمكننا أن نستنتج من كل هذا؟ أجد هذا الأمر برمته رائعًا للغاية ومسليًا للغاية. لقد كنت LOL في هذه الأمثلة طوال اليوم.
برمجة الذكاء الاصطناعي تقلقني
النص هو كل ما تحتاجه: يبدو أن الشخصية أبسط مما كنا نعتقد - بتجاهل البالونات، يعتقد المؤلف أن لدينا أول أخبار مهمة ومحددة لعام 2023 - ردود الفعل الأولية لبرنامج الدردشة الآلي Bing "Sydney". هل هذه هي اللحظة الكوبرنيكية؟ مقالة مثيرة للتفكير. أعتقد أن هذا هو أول موقف "رسمي" جيد حول تأثير إحساسنا بذاتنا الناتج عن ظهور أنظمة المحادثة القائمة على LLM مثل ChatGPT.
باختصار، يبدو أن سيدني لديها آلية مختلفة إلى حد ما تحت الغطاء عن ChatGPT، وتشير النصوص إلى شخصية متشابهة تقريبًا من حيث التماسك، ولكنها قفزة هائلة إلى أبعد من ذلك من حيث الكاريزما والألوان . اعتمادًا على كيفية دفعك لسيدني، يبدو أنه قادر على لعب كل شيء بدءًا من المراهق المتلاعب اللئيم إلى المصاب بالذهان المصاب بجنون العظمة، إلى المارتينيت العنيد والقاطع في المحادثة.
CheatGPT
"ديف، أنت تضع افتراضات. هل يمكنك إثبات أي من هذا؟" أستطيع ذلك، في الواقع، نظرًا لأن بعض عمليات الإرسال التي تتطلب لقطات شاشة تتضمن أيضًا علامات تبويب متصفح ChatGPT، والتي تضمنت بشكل مفيد النص الأولي للمطالبة. على ما يبدو، إنه ليس شيئًا يشعر الطلاب أنهم بحاجة إلى إخفاءه.
أعلنت OpenAI بشكل خاص عن منتج مطور جديد يسمى Foundry (Tweet)، والذي يمكّن العملاء من تشغيل استدلال نموذج OpenAI على نطاق واسع بسعة مخصصة. (يبدو أن GPT-3.5 Turbo يشير إلى نموذج ChatGPT Turbo)
لا تصدق ChatGPT - فنحن لا نقدم خدمة "البحث عن الهاتف".
يتطلب صفي الذكاء الاصطناعي. إليك ما تعلمته حتى الآن - الدروس المستفادة من دمج ChatGPT في التعليم. الوجبات السريعة: 1) يميل العمل الذي يتم إنتاجه عن طريق التحفيز باستخدام نهج التحرير المشترك (تبادل الأفكار ذهابًا وإيابًا باستخدام برنامج الدردشة الآلية) إلى قيام الطلاب بأداء أفضل عمل؛ 2) يحتاج الطلاب إلى أن يتعلموا كيفية كتابة المطالبات بفعالية - فهذا لا يأتي بشكل طبيعي.
الخداع الناشئ والتحسين الناشئ - هل تساءلت لماذا يؤدي توقع LLMs ببساطة للكلمة التالية إلى قدرات التخطيط (السلوك الشبيه بالإنسان، والروايات/التاريخ)؟ يناقش هذا المنشور مفهوم الخداع الناشئ والتحسين الناشئ وهما استراتيجيتان يمكن استخدامهما لتحقيق الهدف. هناك مبدأان للتفكير بشأن القدرات الناشئة المستقبلية: 1) من المحتمل أن تظهر القدرات التي من شأنها تقليل فقدان التدريب في المستقبل. 2) مع زيادة حجم النماذج وتدريبها على بيانات أكثر وأفضل، تميل الاستدلالات البسيطة إلى استبدالها بأخرى معقدة. المبدأ الأول يعني أن طلاب ماجستير اللغة المدربين على التنبؤ بالكلمات يحصلون على خسارة أقل إذا تمكنوا من محاكاة قدرات التخطيط.
كيفية جعل LLM يقول أشياء حقيقية - TL؛ DR: تستخدم الطريقة "النموذج العالمي"، وهي قاعدة بيانات للتضمين مليئة بـ "المعتقدات" (أجزاء من البيانات التصريحية) مع نسبة ثقة يتم حسابها باستخدام نظرية بايز.
لماذا لم تخترع الصين ChatGPT - تقول صحيفة نيويورك تايمز إن الرقابة المفرطة، والتوترات الجيوسياسية مع الولايات المتحدة، ومحاولات السيطرة على شركات القطاع الخاص أدت إلى تخلف الشركات الصينية عن نظيراتها الأمريكية في مجال الذكاء الاصطناعي.
إطلاق أول Chatbot MOSS يشبه ChatGPT في الصين للاختبار العام [رابط مباشر للتطبيق]
بالنسبة للصين، قد يكون ChatGPT تقدمًا ولكنه أيضًا "مشكلة أخلاقية" - يقول وزير العلوم والتكنولوجيا الصيني إن Chatbot قد اجتاح المجتمع الصيني واعتمد تدابير بشأن الذكاء الاصطناعي فيما يتعلق بالأخلاق.
مخططات ChatGPT لتحقيق الثراء السريع قادمة للمجلات وAmazon وYouTube (2023)
تطلق Snapchat برنامج الدردشة الآلي الخاص بها "My AI" والمدعوم من ChatGPT
تم تسريب نموذج لغة الذكاء الاصطناعي القوي LLaMA عبر الإنترنت - ماذا يحدث الآن؟ - نص مقابلة Shawn Presser مع The Verge أكثر إثارة للاهتمام.
أعتقد أنه من المحتمل جدًا أن يكون إصدار هذا النموذج بمثابة إنجاز كبير. إن القدرة على تشغيل LLaMA على وحدة معالجة رسوميات A100 واحدة - والتي "يستطيع معظمنا الوصول إليها... أو نعرف شخصًا يمكنه السماح لنا باستخدام واحدة لبعض الوقت" - هي "قفزة هائلة".
على وجه الدقة، يمكنك تشغيل LLaMA-65B بدقة int8 (bnb) على وحدة معالجة الرسومات A100 واحدة بسعة 80 جيجابايت.
وتبين أن هذا الرمز سيئ. لا أريد حقًا أن أكون قاسيًا جدًا معهم، لأنه من السهل التقليل من مدى أهمية الحصول على الإعدادات الافتراضية بشكل صحيح تمامًا. لكن كل افتراضاتهم كانت فاشلة. لم يستخدموا "Top K". لقد استخدموا Top P، والذي لم أحصل على نتائج جيدة منه أبدًا (إما مطابق لـ top k أو أسوأ قليلاً). كانت درجة الحرارة الافتراضية 0.8، وهي درجة عالية جدًا. والأسوأ من ذلك كله، أنه لم يكن لديهم عقوبة التكرار -- لذلك افتراضيًا، هذا الشيء سوف يثرثر مرارًا وتكرارًا حول نفس الشيء تمامًا.
100% هذا! لقد تعلمت الدرس أيضًا في شوكة LLaMA الخاصة بي. إعدادات أخذ العينات الخاصة بي لم تكن مثالية. التذمر واضح وقد رأيته. لكنني لا أعرف لماذا لم أصلح عقوبة تكرار العينات في وقت سابق.
شرح ChatGPT: دليل نورمي لكيفية عمله - حتى أجدادي يمكنهم فهم ذلك. لكن الطالب الذي يذاكر كثيرا سوف يذاكر كثيرا على أي حال؟
ما الذي يجب عليك استخدام ChatGPT من أجله؟
ما هو واضح بالنسبة لي هو أننا في نموذج جديد للطريقة التي نتنقل بها في المحتوى، سواء من خلال هذا النموذج أو غيره من النماذج التي سيتم إصدارها قريبًا. عند التحفيز، يعطينا الكون الجديد نتائج، لكن هذه النتائج هي عبارة عن ردود فعل اتجاهية أكثر من كونها إجابات ملموسة. والأمر متروك لنا لمعرفة كيفية توجيههم بالطرق التي نريدها للحصول على أفضل النتائج والتغلب على الضوضاء.
تتمتع نماذج اللغات الكبيرة بلحظة الانتشار المستقر (simonwillison.net)
لقد تغير كل هذا بالأمس، وذلك بفضل الجمع بين نموذج LLaMA الخاص بفيسبوك وllama.cpp لجورجي جيرجانوف.
(1) سهل التشغيل على أجهزتي الخاصة
(2) مفتوح المصدر بدرجة كافية بحيث يمكن التلاعب به
(3) كبيرة بما يكفي لتكون مفيدة — وهي تعادل بشكل مثالي قدرات GPT-3
إنها ليست اللحظة المثالية. لقد حققنا 1 و3 باستثناء 2. LLaMA ليس في الواقع مفتوح المصدر (في حين أن ترخيص الكود هو GPL 3، فإن أوزان النموذج ليست كذلك). النماذج المفتوحة حقًا مهمة حقًا.
مع استئناف محادثة GPT-4، يقول رائد التعلم العميق Yoshua Bengio إن ChatGPT هو "جرس التنبيه" - كان جرس التنبيه هو GPT-3 وقوانين التوسع في عام 2021. لقد أصبح صوت المنبه أعلى الآن.
واجهة برمجة تطبيقات ChatGPT جيدة جدًا ورخيصة الثمن، مما يجعل معظم إنشاء النصوص باستخدام الذكاء الاصطناعي أمرًا قديمًا
تم التأكيد: يعمل Bing الجديد على GPT-4 الخاص بـ OpenAI - وكان Bing Chat (سيدني) هو GPT-4 طوال الوقت.
ويكيبيديا - تجربة جيدة لـ GPT-4.
مستقبل الذكاء الاصطناعي العام متعدد الوسائط والنماذج المتعددة وكل شيء - خلاصة GPT-4.
هل يستطيع GPT-4 كتابة التعليمات البرمجية فعليًا ؟ - اختبار قدرات كتابة التعليمات البرمجية لـ GPT 4 مع بعض المشكلات الفعلية في العالم الحقيقي.
هل يمكنك تدريب نموذج يتفوق على ChatGPT مقابل 85000 دولار وتشغيله في المتصفح؟
GPT4: الأجزاء الهادئة وحالة ML
GPT-4 صممت لغة برمجة
القدرات غير المتوقعة الناشئة عن نماذج الذكاء الاصطناعي الكبيرة
جرّب Bard وشارك تعليقاتك - بدأت Google في فتح الوصول إلى Bard، وهي تجربة مبكرة تتيح لك التعاون مع الذكاء الاصطناعي التوليدي. لقد بدأوا بالولايات المتحدة والمملكة المتحدة، وسوف يتوسعون ليشمل المزيد من البلدان واللغات بمرور الوقت.
يتخلف Bard من Google عن GPT-4 وكلود في المقارنة وجهاً لوجه
تقدم NVIDIA الذكاء الاصطناعي التوليدي إلى المؤسسات العالمية من خلال الخدمات السحابية لإنشاء نماذج لغوية ومرئية كبيرة - إن NVIDIA AI Foundations هي شركة NVIDIA التي تتجاوز مجرد مزود الأجهزة إلى البرامج التي تدعم الذكاء الاصطناعي التوليدي بعروضها لكل عبء عمل، بدءًا من النموذج الأساسي كخدمة (قادمة إلى المؤسسة، ومخصصة لبيانات الملكية الخاصة بك) إلى الوسائط المتعددة من اليوم الأول.
GitHub Copilot X: تجربة المطور المدعومة بالذكاء الاصطناعي - يتطور GitHub Copilot لتوفير واجهات الدردشة والصوت، ودعم طلبات السحب، والإجابة على الأسئلة في المستندات، واعتماد OpenAI's GPT-4 للحصول على تجربة مطور أكثر تخصيصًا.
الغش هو كل ما تحتاجه بقلم ستيف ييجي، المصدر.
هناك شيء أسطوري وتاريخي يحدث في هندسة البرمجيات، الآن ونحن نتحدث، ومع ذلك فإن معظمكم لا يدرك على الإطلاق مدى حجمه.
لا تعد شهادات LLM مجرد التغيير الأكبر منذ وسائل التواصل الاجتماعي أو الهاتف المحمول أو السحابية، بل هي أكبر شيء منذ WWW.
أعني أن هذه الأشياء قوية بشكل لا يصدق . ومع ذلك، فإنني أقابل باستمرار بمزيج من عدم التصديق والتشبث باللؤلؤ.
... خمس مرات أكثر إنتاجية. ؟
نبذة مختصرة عن تاريخ LLMs
الجملة النهائية، وهي بصراحة واحدة من أصعب الأشياء التي يصعب شرحها، لذلك سأتبع الطريق القائم على الإيمان اليوم، هي أن جميع الفائزين في مجال الذكاء الاصطناعي سيكون لديهم خنادق بيانات . ... لماذا؟ لأن خندق البيانات هو الطريقة التي تملأ بها نافذة السياق ("ورقة الغش") .
LLMs ليست بدعة غبية، مثل العملات المشفرة. نعم، كان التشفير بدعة غبية. هذا ليس ذلك.
Google "ليس لدينا خندق، ولا OpenAI أيضًا" - تزعم وثيقة Google الداخلية المسربة أن الذكاء الاصطناعي مفتوح المصدر سوف يتفوق على Google وOpenAI.
لقد بدأ النهج الأكبر هو الأفضل في التعامل مع الذكاء الاصطناعي ينفد
فهم رموز GPT المميزة بقلم سايمون ويليسون.
منظمة العفو الدولية كانون
لقد بدأ الأمر يصبح غريبًا - فلنتحدث عن ChatGPT مع Code Interpreter وMicrosoft Copilot.
يلعب دونالد كنوث مع ChatGPT - كنوث عالم كمبيوتر. يُعرف باسم "أبو" تحليل الخوارزميات.
مؤتمر Google I/O 2023 ومعارك الذكاء الاصطناعي القادمة
نماذج غير خاضعة للرقابة - معالج غير خاضعة للرقابةLM. نظرًا لوجود عمل تم إنجازه بالفعل لإلغاء الرقابة على Vicuna، فقد تمكنت من إعادة كتابة البرنامج النصي الخاص بهم بحيث يعمل على مجموعة بيانات WizardLM.
بنية نموذج GPT-4 (تغريدات) - مستمدة من المصدر الأصلي (منشور مدونة): بنية GPT-4، البنية التحتية، مجموعة بيانات التدريب، التكاليف، الرؤية، وزارة التربية والتعليم
Llama 2: LLM مفتوح لا يصدق - أفضل ملخص لورقة Llama 2.
اللاما 2 – كل الموارد التي تحتاجها بقلم فيليب شميد.
نماذج لغوية كبيرة، مشروحة بالحد الأدنى من الرياضيات والمصطلحات - بدا الأمر وكأنه شرح جيد لكيفية عمل ماجستير إدارة الأعمال. لا أعرف كيف أقدر القسم الأخير الذي يتناول القليل من الفلسفة والنظريات حول كيفية تعلم الإنسان. (القسم الأخير يفتقر إلى التأكيد المبني على الأدلة)
لذا فأنت تريد إنشاء برنامج chatbot مفتوح المصدر خاص بك على طراز ChatGPT (hacks.mozilla.org)
كيف يمكن LLaMa.cpp؟ (finbarr.ca) - قبل وقت طويل من انتشار LLM، كان الجميع يقولون إن النماذج الكبيرة تتطلب الكثير من وحدات معالجة الرسوميات باهظة الثمن. مثل المؤلف، نريد أن نثبت خطأهم. أخذ كاتب هذا المنشور ارتباكه وتعمق في الرياضيات المحيطة بمتطلبات الاستدلال لفهم القيود التي نتعامل معها. من المثير للدهشة أنه لا يوجد سحر هنا، فقط أشياء تتجاوز فهمنا في البداية. إن ضغط النموذج أو التكميم بشكل أكثر تحديدًا يجعل ذلك ممكنًا. ومع ذلك، لا يوجد "غداء مجاني" - فتكلفة النموذج الكمي هي في الأساس أنك تفقد بعض الدقة. وهذا يعني أنه بالنسبة لأحجام النماذج الكبيرة جدًا، قد تكون الاختلافات ضئيلة. فضولي؟ أجرى هذا المنشور شبه ذي الصلة مقارنة بين التعقيدات/الدقة المختلفة للمحولات الكمية.
التغلب على GPT-4 على HumanEval باستخدام CodeLlama-34B المضبوط بدقة (www.phind.com) - تقدم جيد وليس مفاجأة كبيرة. لقد أدركت أن مثل هذه المعايير الخاصة بالنماذج تكون عرضة لأن تكون مقاييس ضعيفة لقياس مدى جودة أداء النماذج في العمل الفعلي في العالم الحقيقي. تلك كانت تجربتي مع النماذج المفتوحة.

2024

شاهد المزيد

ملاحظات حول نماذج سلسلة الأفكار الجديدة o1 الخاصة بـ OpenAI بقلم سايمون ويليسون.

مقارنة بين مهام العالم الحقيقي والمعايير

نحن بحاجة إلى معايير أو نوع من التقييمات المستقلة والإنسانية لمهام العالم الحقيقي .

ما مدى جودة "محركات الرد" الخاصة بالذكاء الاصطناعي؟ - القليل من الانحياز تجاه كاجي.
GPT-4 والمعايير المهنية: الإجابة الخاطئة على السؤال الخطأ
أفضل طريقة لتقييم النماذج اللغوية (تغريدة) بقلم سام بومان، أنثروبي، 2023

المطالبة (برمجة المطالبة ³ )*

وفقا لجويرن:

نموذج برمجة جديد؟ أنت تتفاعل معها، وتعبر عن أي مهمة من حيث أوصاف اللغة الطبيعية والطلبات والأمثلة، وتعديل الموجه حتى "يفهم" ويتعلم المهمة الجديدة. هذه طريقة مختلفة لاستخدام النموذج، ومن الأفضل التفكير فيه كنوع جديد من البرمجة، البرمجة السريعة ، حيث أصبحت المطالبة الآن لغة ترميز تقوم ببرمجة GPT-3 للقيام بأشياء جديدة.

"المطالبة" باعتبارها تخصصًا هندسيًا ليست موجودة لتبقى. إنها عكاز مؤقت في الطريق إلى واجهات اللغة الطبيعية. يحل ChatGPT جزءًا كبيرًا من مشكلة المطالبة. قد يكون من غير الضروري إضافة هندسة إلى مصطلح ما لتضخيم أهميته أو صعوبته. ربما يمكننا أن نسميها "الاختبار/القرصنة السريعة" ولا نفقد أيًا من معناها.

مطالبة الموارد

أفضل دليل هندسي سريع للمطورين الذين يعملون مع نماذج اللغات الكبيرة مثل GPT-4 وChatGPT والنماذج المفتوحة مثل LLaMA سيكون مزيجًا من موارد متعددة. فيما يلي بعض موارد التعلم والأدوات والمكتبات وأطر العمل لمساعدتك على تعلم الهندسة السريعة وإتقانها:

دليل الهندسة السريعة من DAIR.AI - أدلة وأوراق ومحاضرات وموارد للهندسة السريعة. يغطي هذا القسم أحدث التقنيات الهندسية السريعة لـ GPT-4، بما في ذلك النصائح والتطبيقات والقيود ومواد القراءة الإضافية.
تعلم المطالبة - هذا الموقع عبارة عن دليل مجاني مفتوح المصدر حول الهندسة السريعة.
ChatGPT3-Free-Prompt-List - دليل مجاني (وإطار عمل) لتعلم كيفية إنشاء مطالبات ChatGPT3.
PromptArray - لغة مطالبة لمولدات النص العصبي.
PromptLayer هي أداة للمهندسين الفوريين - احتفظ بسجل للمطالبات وطلبات OpenAI API. تتبع وتصحيح وإعادة تشغيل الإكمالات القديمة. بناء المطالبات من خلال التجربة والاستكشاف.
الهندسة السريعة بقلم ليليان ونج - المعروف أيضًا باسم. تشير المطالبة في السياق إلى طرق كيفية التواصل مع LLM لتوجيه سلوكها لتحقيق النتائج المرجوة دون تحديث أوزان النموذج .
يمكّنك التوجيه من التحكم في نماذج اللغة بشكل أكثر فعالية وكفاءة من التحفيز أو التسلسل التقليدي.
هندسة ChatGPT الفورية للمطورين - دورة قصيرة مجانية مقدمة من DeepLearning.AI، بالتعاون مع OpenAI. هذه الدورة مناسبة للمبتدئين، وتتطلب فقط فهمًا أساسيًا للغة Python، وهي مناسبة لمهندسي التعلم الآلي المتقدمين الذين يرغبون في الاقتراب من أحدث الهندسة السريعة واستخدام ماجستير إدارة الأعمال.
دليل Brex's Prompt Engineering - يوفر قدرًا كبيرًا من المعلومات حول الهندسة السريعة، بما في ذلك النصائح والحيل للعمل مع LLMs مثل GPT-4، وإدارة نوافذ السياق، وتفاصيل حول LLMs المختلفة.
كتالوج الأنماط السريعة لتعزيز الهندسة السريعة باستخدام ChatGPT (ورقة) من جامعة فاندربيلت، 2023 - الأنماط السريعة هي طريقة لنقل المعرفة تشبه أنماط البرامج لأنها توفر حلولاً قابلة لإعادة الاستخدام للمشكلات الشائعة التي تواجهها في سياق معين. هو - هي:
- يوفر إطارًا لتوثيق الأنماط من أجل هيكلة المطالبات بحل مجموعة من المشكلات بحيث يمكن تكييفها مع مجالات مختلفة
- يقدم كتالوجًا للأنماط التي تم تطبيقها بنجاح
- يشرح كيف يمكن بناء المطالبات من أنماط متعددة لتحسين مخرجات محادثات LLM
تقنيات الهندسة السريعة بواسطة خدمة Azure OpenAI - هناك العديد من التقنيات المتقدمة في التصميم السريع والهندسة السريعة التي يمكن أن تساعد في زيادة دقة وتأصيل الاستجابات التي يتم إنشاؤها بواسطة LLM. يمكن تعميم هذه التقنيات عبر أنواع مختلفة من النماذج، ولكن بعض النماذج تتوقع هياكل سريعة محددة.
مثال على المطالبة LLM للبرمجة (2023)
الهندسة السريعة مقابل التوجيه الأعمى (2023)

باستخدام هذه الموارد، يمكنك الحصول على فهم قوي للهندسة السريعة وتطوير المهارات اللازمة للعمل بفعالية مع LLMs.

( * تمت إعادة تسمية المصطلح الهندسي الفوري إلى المطالبة. هذا المصطلح محمل بشكل زائد وقد يكون غير ضروري. )

أدوات التحريض

موجه - اختبر المطالبات الخاصة بك. تقييم ومقارنة مخرجات LLM، والتعرف على الانحدارات، وتحسين الجودة السريعة.
iarawjo/ChainForge - بيئة برمجة مرئية مفتوحة المصدر لمطالبات اختبار المعركة لحاملي LLM.
mshumer/gpt-prompt-engineer - ما عليك سوى إدخال وصف لمهمتك وبعض حالات الاختبار، وسيقوم النظام بإنشاء عدد كبير من المطالبات واختبارها وتصنيفها للعثور على تلك التي تحقق أفضل أداء. (ملاحظة جانبية: الطريقة التي تقيم بها ماجستير إدارة الأعمال فكرة سيئة. إنها تصنف المطالبات باستخدام GPT-4 والثقة دون إشراف. لا تعامل ماجستير إدارة الأعمال كمطرقة؛ قم بتطبيق "auto-*" على كل شيء.)

أمثلة

Reddit: كسر حماية ChatGPT باستخدام موجه يسمى DAN (افعل أي شيء الآن)
Reddit: كسر الحماية النهائي لـ ChatGPT، مجاني بالكامل، مع أوامر المستخدم وآرائه والوعي المتقدم والمزيد! - نسخة DAN مطورة (9 يناير).
Jailbreak Chat - قائمة الهروب من السجن ChatGPT. الاستجابة السريعة "وضع التطوير" مضحكة.

أوراق

مجموعة Flan: تصميم البيانات وأساليب لضبط التعليمات الفعالة من قِبل Google Research ، 2023 - ما هو أفضل منافس عام تمامًا في ChatGPT؟ Flan-T5 يتفوق على جميع النماذج العامة التي اختبروها. أنها تجعل مجموعة Flan (المستخدمة لأول مرة في الفلان) من مجموعات البيانات والقوالب والأساليب المتاحة للجمهور. [رمز توليد البيانات] [تغريدة]
هل chatgpt عبارة عن محللي لمهمة معالجة اللغة الطبيعية للأغراض العامة؟ بواسطة NTU ، AWS ، Stanford U et al. ، 2023 - لم يكن معروفًا بعد ما إذا كان ChatGPT يمكن أن يكون بمثابة نموذج عام يمكنه أداء العديد من مهام NLP صفرية. في عملهم ، يقومون بتحليل قدرة التعلم الصفري للدردشة من خلال تقييمها على 20 مجموعة بيانات شهيرة NLP التي تغطي 7 فئات مهام تمثيلية. مع دراسات تجريبية واسعة النطاق ، فإنها تظهر كل من فعالية وقيود الإصدار الحالي من chatgpt.
chatgpt: جاك من جميع المهن ، ماجستير من لا شيء من قبل J.Kocoń et al. ، 2023 - يتم اختبار الدراسات النوعية الحالية على نطاق محدود للغاية. فحص عملهم قدرات ChatGPT على 25 مهام NLP التحليلية المتنوعة. لقد قاموا بتآكل عملية الاستعلام عن ChatGPT وتحليل أكثر من 38 كيلو بايت . الإعداد التجريبي المثير للاهتمام: "بدون واجهة برمجة تطبيقات رسمية ، قاموا بتعديل واستخدموا واجهة برمجة تطبيقات غير رسمية تسمى Pygpt. أثناء البحث ، استغلوا ما يصل إلى 20 حسابًا لجمع البيانات فيما يتعلق بـ 25 مجموعة بيانات."
Chatie: استخراج معلومات الصفر من خلال الدردشة مع ChatGpt بواسطة Beijing Jiaotong U et al. ، 2023
حول متانة chatgpt: منظور الخصومة والتوزيع من قبل Microsoft Research et al. ، 2023.
ChatGPT: تحليل تلوي بعد 2.5 شهرًا من قبل NLLG ، 2023 - تحقيق شامل ومناقشة حول الآراء العامة والأكاديمية حول ChatGPT استنادًا إلى 300 ألف تغريدة و 150 ورقة.
ما الذي يجعل وكيل الحوار مفيدًا؟ بقلم Rajani et al. ، مدونة Hugging Face ، 2023.
Visual ChatGPT: الحديث ، الرسم والتحرير مع نماذج Foundal Foundation من قبل Microsoft Research Asia ، 2023 - تقوم المجموعة بإنشاء نظام يدمج نماذج مرئية مختلفة للسماح للمستخدم بالتفاعل مع ChatGPT من خلال النص ليس فقط ولكن أيضًا الصور. [Demo (GIF)]
chataug: الاستفادة من chatgpt لزيادة البيانات النصية من قبل U of Georgia et al. ، 2023 - نهج تكبير البيانات النصية يعتمد على chatgpt. يعيد Chataug إعادة صياغة كل جملة في عينات التدريب إلى عينات متعددة متشابهة من الناحية المفاهيمية ولكنها مختلفة من الناحية الدلالية. يمكن بعد ذلك استخدام العينات المعززة في التدريب على النموذج المصب. (حسنًا ، أتساءل الآن لماذا يتجنب OpenAssistant هذه الفكرة في وقت سابق)

التعليمية

فيديوهات

هذا الذكاء الاصطناعى لديه جيلبريك؟! بقلم Yannic Kilcher - إذا كنت في الفيديو ، فقد أعطى هذا نظرة عامة جيدة.
Chatgpt vs Sparrow - Battle of Chatbots by "AI Coffee Break" مع Letitia - "أمي ، أريد ورقة حول Chatgpt. Chatgpt at Home: Sparrow from DeepMind."
ChatGPT - أوضح - تشغيل سريع من خلال الأعمال الداخلية لـ ChatGPT والمفاهيم الأساسية التي تكمن عليها: نماذج اللغة والشبكات العصبية المحولات ونماذج GPT وتعلم التعزيز.
State of GPT من قبل Andrej Karpathy ، Openai ، 2023 - شاهد ما إذا كان لديك فضول معتدل حول العمل مع LLMs لأي مهام. سوف تسير عليك الجلسة عبر كل خطوة من خط أنابيب تدريب مساعد GPT. وعدم خصم كيفية تطبيق هذه النماذج بشكل فعال.
دورة مسار التعلم من الذكاء الاصطناعي ، تديرها Google Cloud.

المزيد: مقاطع فيديو YouTube من coreated.tivul.com (لم أطلع هذا على ذلك ، لذلك لا تكون الجودة مضمونة)

تغريدات

هل تتساءل كيف تعمل نماذج اللغة الكبيرة مثل chatgpt و expructgpt بالفعل؟ دعونا نغوص في كيفية عمله في 8 تغريدات!

كتب

يطالب ChatGPT بالتحسن: دليل لصياغة مطالبات واضحة وفعالة

تطوير

تنمية التطبيقات الأصلية الذكاء الاصطناعي. تكامل chatgpt. تطبيقات الجيل القادم من الذكاء الاصطناعي. طبقة "App Store" لنماذج اللغة (بما في ذلك Huggingface "App Store").

واجهة برمجة التطبيقات غير الرسمية و SDK.

Rawandahmad698/Pychatgpt (Python) - API خفيفة الوزن ، على أساس TLS على CLI الخاص بك دون الحاجة إلى متصفح أو رمز الوصول.
ACHEONG08/ChatGPT (Python) - حزمة خفيفة الوزن للتفاعل مع API من ChatGPT من Openai. يستخدم عكس API الرسمية المهندسة.
Bullshit/chatgpt-api (node.js)-Node.js عميل لاتصالات chatgpt غير الرسمية واستخدام متصفح مقطوع الرأس.
chatgpt-MS-API chatgpt متعدد الجلسة. يتم نسخ الكود الرئيسي من Pychatgpt.

أدوات

Safer-Prompt-Evaluator-هذا يوضح النتائج من استخدام Second ، Filter LLM الذي يحلل المطالبات قبل إرسالها إلى ChatGPT.
Dust - تصميم ونشر تطبيقات نموذج اللغة الكبيرة (LLM). نماذج توليد مواصفات التطبيق ومحرك التنفيذ. الهندسة السريعة ، التي أعيد تخيلها بهدف واحد ، تساعد في تسريع نشر LLMS.
Langchain - بناء تطبيقات مع LLMs من خلال التكلفة. [البرامج التعليمية الجيدة حول وكلاء Langchain - الانضمام إلى الأدوات والسلاسل مع قرارات Sam Witteveen (فيديو)]
يحتوي Llamaindex (مؤشر GPT) على مجموعة أدوات من هياكل بيانات الفهرس المصممة لتوصيل LLM بسهولة بالبيانات الخارجية الخاصة بك. [مستندات]
EVALS هو إطار لتقييم أداء نماذج Openai وتسجيل مفتوح المصدر من المعايير. يتيح لأي شخص الإبلاغ عن أوجه القصور في نماذج Openai للمساعدة في توجيه المزيد من التحسينات.
Chatbot UI - استنساخ Frontend ChatGpt للتشغيل محليًا في متصفحك.
next.js chatgpt - تطبيق الدردشة المتجاوب مدعوم من GPT -4 من Openai ، مع دفق الدردشة ، وتمييز الكود ، وتنفيذ التعليمات البرمجية ، والإعدادات المسبقة للتطوير ، والمزيد.
kernel الدلالي (SK) بواسطة Microsoft - دمج تقنية LLM المتطورة بسرعة وسهولة في تطبيقاتك. يدعم SK القدر السريع ، والسلاسل الوظيفية ، والذاكرة المتجانسة ، وقدرات التخطيط الذكي خارج الصندوق.
Simpleaichat - Python Package للتداخل بسهولة مع تطبيقات الدردشة ، مع ميزات قوية وحد من تعقيد الكود. سبب simpleaichat ، انظر المشكلة مع Langchain.
OpenLLM - منصة مفتوحة لتشغيل نماذج لغة كبيرة (LLMS) في الإنتاج. صقل ، خدمة ، نشر ، ومراقبة أي LLMs بسهولة.
GGML - AI على الحافة. إنها مكتبة موتر للتعلم الآلي لتمكين النماذج الكبيرة والأداء العالي على أجهزة السلع الأساسية. يتم استخدامه بواسطة llama.cpp و whisper.cpp.

ملحقات chatgpt

chatgpt Retrieval Plugin by Openai - يوفر حلاً مرنًا للبحث الدلالي واسترجاع المستندات الشخصية أو التنظيمية باستخدام استعلامات اللغة الطبيعية.
GPT4-PDF-Chatbot-Langchain-GPT-4 & Langchain chatbot لمستندات PDF الكبيرة.
كل ما تحتاج إلى معرفته لإنشاء مكون إضافي ChatGpt (2023) - غوص عميق في تطوير مكونات الإضافات ChatGpt للمبتدئين والمستكشفين الغريبين. (الأمر يستحق القراءة حتى لو لم تكن مطورًا.)
قوائم رهيبة
- Gerevai/Awesome-Chatgpt-Plugins
- Jeadie/Awesome-Chatgpt-Plugins

أنظمة الوكلاء المستقلة مع نموذج اللغة

LLM يعمل عوامل مستقلة مدعومة (منشور بلوق) من قبل ليليان ونغ ، 2023.
تمتد إمكانات LLM إلى ما بعد توليد نسخ مكتوبة جيدًا وقصص ومقالات وبرامج ؛ يمكن تأطيره باعتباره حل المشكلات العامة القوية.
في نظام العامل المستقل الذي يعمل بـ LLM ، يعمل LLM كأخلي العميل ، ويكمله العديد من المكونات الرئيسية: التخطيط والذاكرة والأدوات.
التحديات: التخطيط طويل الأجل وتحلل المهام ، موثوقية واجهة اللغة الطبيعية.
SMOL Developer - تضمين وكيل مطور في التطبيق الخاص بك.

تغريدات

الإضافات لمعالجة مقطع الفيديو ، لا مطلوب معالج FFMPEG. حالة الاستخدام الفعلية من إطلاق اليوم. بقلم جريج بروكمان ، Openai - قدرة ChatGPT المثيرة للاهتمام على تشغيل وتنفيذ رمز Python. من المذهل أنه يمكن تشغيل FFMPEG!
مكونات chatgpt بسيطة للغاية في التنفيذ - في الأساس فقط توثيق واجهة برمجة التطبيقات الخاصة بك ، ولكن لنموذج اللغة بدلاً من الإنسان. بقلم جريج بروكمان ، Openai - أسهل بكثير من التعامل مع Extension Extension V3.

أنظمة الاسترجاع

أنظمة الاسترجاع للوصول إلى مصادر المعلومات الشخصية أو التنظيمية. التضمين. قاعدة البيانات ومتجر البيانات المصممة لنماذج التعلم الآلي و NLP.

Openai Embeddings - Text Text's Text يقيس العلاقة بين السلاسل النصية.

قواعد بيانات المتجهات لفهرسة المستندات والبحث

كوز الصنوبر
MILVUS - قاعدة بيانات متجه مفتوحة المصدر تم تصميمها لبحث التشابه وتضمين الطاقة وتطبيقات الذكاء الاصطناعى.
QDRANT - محرك بحث تشابه المتجه وقاعدة البيانات. إنه يجعلها مفيدة لجميع أنواع الشبكات العصبية أو المطابقة المستندة إلى الدلالي ، والبحث المسموح به ، والتطبيقات الأخرى. يمكن تحويل التضمينات أو تشفير الشبكة العصبية إلى تطبيقات كاملة.
Weaviate-محرك بحث متجه مفتوح المصدر يخزن كلاً من الكائنات والمتجهات ، مما يتيح الجمع بين البحث المتجه مع التصفية المهيكلة مع تسامح الأخطاء وقابلية التوسع لقاعدة بيانات سحابة أصلية ، وكلها يمكن الوصول إليها من خلال GraphQL و REST والعملاء اللغويين المختلفين.
PGVector - امتداد Search PostgreSQL للتشابه مفتوح المصدر. [مثال: GPT3.5-TURBO-PGVECTOR]

منشورات المدونة والمقالات

بناء chatbot باستخدام قاعدة المعرفة المحلية ، chatgpt و pinecone
لقد قمت ببناء مكون إضافي ChatGpt للإجابة على أسئلة حول البيانات المستضافة في DataSette (SQLite)
كل الأشياء الصعبة لا أحد يتحدث عنها عند بناء منتجات باستخدام LLMS - "LLMS بطيئة ...". في تجربتي الخاصة ، فإن هذا يجعل LLMs غير عملي لبعض النشر الواسع النطاق ، على سبيل المثال ، وكيل مكشطة الويب مع GPT-4 (نموذج GPT-3.5 توربو لديه زمن استمرار أفضل ولكن لا يزال أبطأ 10x من المحلول المرميز يدويًا). هناك تقنيات يمكنك استخدامها لتحسين الكمون الاستدلال النموذج. كتابة تعليمات موجزة في المطالبة فعالة ولكنها صعبة. يعد تقليل الرموز في المطالبات أمرًا سهلاً-نص ما قبل العملية (نظيف ، إعادة إصلاح ، minify ، إلخ)
دروس من إنشاء امتداد VSCode مع GPT-4
Ray-Project/LLM-Numbers-أرقام يجب أن يعرف كل مطور LLM.
مشكلة Langchain (2023)

بيانات التدريب

LAION LLM - جمع البيانات من أجل وتدريب ومشاركة نماذج LANION LANGY LANGUES (LLLM). لا تزال المجموعة تكتب اقتراحًا تقنيًا لهندسة Flant5-Atlas (أو ChatGpt@Home Man Por Man).
Open-Chatgpt-Prompt-Prompt-collection by Surface Data Collective-موقع ويب لإنشاء مطالبات لتدريب نموذج chatgpt مفتوح.
BigScience P3 DataSet - P3 (المجموعة العامة للمطالبات) هي مجموعة من مجموعات البيانات الإنجليزية المطلوبة تغطي مجموعة متنوعة من مهام NLP. (ProderSource ، مجموعة أدوات لإنشاء ومشاركة واستخدام المطالبات)
تكبير البيانات لإنشاء نص النموذج - مناقشة حول خلاف Laion. مفتاح إنشاء flant5 أفضل (chatgpt@home).
TrintSprompts مجموعة البيانات من قبل Fair.
قوالب لـ Flan (نماذج اللغة المحفوظة بالحيوية هي متعلمين صفري)
Openai Buff -Backbacket على مركز Face Hub - مجموعة البيانات من ورقة "التعلم إلى تلخيص من التعليقات البشرية" ، حيث قاموا بتدريب نموذج مكافأة RLHF للتلخيص.
ستانفورد تفضيلات الإنسان مجموعة بيانات (SHP) - مجموعة من التفضيلات البشرية الجماعية 385K التي تحدث بشكل طبيعي على النص في 18 مجالًا. يمكن أن يكون SHP مكملاً رائعًا لمجموعة بيانات HH-RLHF الخاصة بشهر الإنسان. لديهم أيضًا نموذجين من Flan-T5 من Flan-T5 على كلا مجموعات البيانات. [تغريدة من أحد المؤلف]
عوامل النموذج اللغوي-مجموعة بيانات جديدة تحتوي على مجموعة متنوعة من مجموعات بيانات التعليمات لضبط النماذج اللغوية الكبيرة. بالإضافة إلى ذلك ، يحتوي المشروع على بعض البرامج النصية للبيانات البسيطة وتدريب لتدريب تعليمات تم ضبطها LLM وتجربة (IPYNB) بعض إصدارات ألفا المبكرة (Pythia13b-instruct) من العوامل المضبوطة بالتعليمات.
البنية الذاتية: محاذاة LM مع التعليمات التي تم إنشاؤها ذاتيا - مجموعة بيانات جيدة لنماذج تعليمات التدريب لتكون جيدة مثل addructgpt بواسطة Openai. يحتوي على تعليمات 52 كيلو ، مقترنة مع مدخلات ومخرجات 82 كيلو كيلو. كما يصدرون مجموعة جديدة من 252 مهمة مكتوبة بالخبراء وتعليماتهم المستخدمة في التقييم البشري.
في أوراق Openai على GPT-2 و GPT-3.X ، ذكروا الإشارات إلى مجموعات البيانات هذه:
- الزحف المشترك
  - عدد الرموز: 410 مليار
  - الوزن في مزيج التدريب: 60 ٪
- WebText2
  - مجموعة بيانات الإنترنت التي تم إنشاؤها عن طريق كشط عناوين URL المستخرجة من عمليات إرسال Reddit بحد أدنى درجة من 3 كبديل للجودة ، المكرسة على مستوى المستند مع Minhash
  - عدد الرموز: 19 مليار
  - الوزن في مزيج التدريب: 20 ٪
- كتب 1 ⁴
  - عدد الرموز: 12 مليار
  - الوزن في مزيج التدريب: 8 ٪
- Books2 ⁴
  - عدد الرموز: 55 مليار
  - الوزن في مزيج التدريب: 8 ٪
- ويكيبيديا
  - عدد الرموز: 3 مليارات
  - الوزن في مزيج التدريب: 3 ٪

chatgpt مفتوح المصدر

نريد بديل chatgpt مثل الانتشار المستقر.

محبط من جميع حرارة البوابة حول الذكاء الاصطناعي؟ ما زلت تنتظر أو لا يمكنك الوصول إلى لاما؟

الأهداف

جهد مفتوح المصدر نحو chatgpt من Openai.
مهندس عكسي وتكرار نماذج ChatGpt وبيانات التدريب.
نماذج مفتوحة حقا. 100 ٪ غير ربحية. مجاني 100%.

الهدف النهائي: النسخة المستضافة ذاتيا من chatgpt.

دروس

الوجبات السريعة من Eleutherai سنة واحدة Retro (2021):

لن يساعدك الوصول إلى ما يكفي من الحساب/الأجهزة/GPU وحده. أنت بحاجة إلى:
- مجموعة بيانات مناسبة (وراء الوبر و C4)
- الخبرة البحثية
- القدرات الهندسية
- الكثير من العمل الشاق

المشاريع

Flan-T5 XXL AKA. chatgpt@home هو نموذج عام خضع لتصنيع التعليمات. XXL هو طراز 11B. إنه حاليًا النموذج الأكثر قابلية للمقارنة مقابل ChatGPT (تتم تهيئة نماذج addructGPT من سلسلة GPT-3.X (بطاقة النموذج)). هناك محاولات ناجحة نشر Flan-T5 على GPU مع ذاكرة وصول عشوائي 24 جيجابايت مع استنتاج Bitsandbytes-int8 لنماذج الوجه المعانقة. يمكنك تشغيل النموذج بسهولة على جهاز واحد ، دون تدهور الأداء. يمكن أن يكون هذا مغيرًا في تمكين الأشخاص خارج شركات التكنولوجيا الكبرى من استخدام هذه LLMs. الجهود جارية بالفعل لإنشاء Flan-T5 أفضل. يعمل المجتمع (IE ، Laion) على بنية Flant5-Atlas ومجموعة من مجموعات البيانات المطلوبة/التعليمات.
- صقل GPT-J-6B في كولاب: الأوزان 8 بت مع محولات منخفضة الرتبة (LORA). (نموذج Eleutherai/GPT-J-6B الكمي مع الأوزان 8 بت)
  - كم عدد GPU وكم VRAM المطلوب لتشغيل النموذج؟ حوالي 175 جيجابايت أو ~ 8x 24 جيجابايت وحدات معالجة الرسومات المستهلك. التفاصيل: مقدمة لطيفة لضرب المصفوفة 8 بت للمحولات على نطاق واسع باستخدام محولات الوجه المعانقة والتسريع و bitsandbytes
- لماذا flan-t5؟ إنها أكثر توافقًا من LLM الأخرى لأنها تم تحريكها بالفعل مع التعليمات. علاوة على ذلك ، أكبر إصدار ، يمكن تشغيل 11B على NVIDIA T4 واحد.
- تسريع الحوسبة التعليمية العميقة - التدريب الفعال ، والاستدلال الفعال (النشر) ، والنماذج الموفرة للبيانات/الذاكرة ، والضغط (بنيات فعالة).
  - تطبيق تقنيات الضغط مثل القياس من مشروع ضغط نموذج ML الرائع.
مهندس مفتوح-تكرار chatgpt مفتوح المصدر من قبل لاون ، يانيك كيلشر وآخرون. يهدف هذا المشروع إلى منح الجميع إمكانية الوصول إلى نموذج لغة كبير قائم على الدردشة. (Assistant Assistant Live Coding with Yannic Kilcher (Video)) خطط عالية المستوى:
المرحلة 1: جمع موجات للتكوين الخاضع للإشراف (SFT) وللحصول على المطالبات لإكمال/إجابات تم إنشاؤها النموذجية.
المرحلة 2: ردود الفعل البشرية (على سبيل المثال) لمخرجات متعددة ناتجة عن النموذج. مثال يتم عرض مخرجات النماذج خمسة ويجب على المستخدم تصنيفها من الأفضل إلى الأسوأ.
المرحلة 3: التحسين مع RLHF الذي نخطط للقيام به عبر TRLX. ثم نتكرر مع هذا النموذج الجديد مرة أخرى خلال المرحلة 2 والمرحلة 3 نأمل عدة مرات.
سيتم تدريب النماذج على الحاسبات الفائقة القمة (حوالي 6 ملايين NVIDIA V100 ساعة في السنة) [المصدر]
مزيد من المعلومات ، راجع اقتراح LAION LLM (DOC Google) أعلاه.
تقدم:
- فبراير 2023: JOI-20B-instruct هو نموذج 20B تم ضبطه على مجموعة متنوعة من مجموعات بيانات التعليمات ويستند إلى Neox-20b.
  غير رسمي: هذا نموذج مبكر قبل الإصدار (جزء من تطوير MVP ، المرحلة 1) ، وليس مفتوحًا مباشرة (OA). إنها تجارب من قبل فريق ML لمعرفة البيانات ونموذج الأساس والأساليب ستعمل بشكل جيد مع OA. كما هو مذكور في الأسئلة الشائعة حول الموقع ، لا يوجد تجريبي حتى الآن. هذا هو للمطورين اختبار إصدار التطوير المبكر من ضبط التعليمات للنموذج. ربما سيتم اشتقاق نماذج الزراعة العضوية الأولى من هذه. لقد تم تدريب نماذج جيدة على أساس التدحرج مع اكتمال مجموعات البيانات الجديدة. هناك مجموعة متنوعة من أحجام النماذج من 1.4B إلى 20B Params المتوفرة على HF HUB.
  بناء chatty-lms عن طريق Huggingface H4 Team-واجهة المستخدم لاختبار نموذج Joi-20b-instruct. يمكنك الدردشة معها. سوف يرد الوكيل باسم JOI (لقب الروبوت).
  مثال على مقتطف رمز لتشغيل النموذج على وحدات معالجة الرسومات الخاصة بك: https://gist.github.com/cedrickchee/236e53ed2dca95bd96e5baa35cdd7be22
- مارس 2023: يقومون حاليًا بمعالجة البيانات التي تم جمعها من المساهمات. تحتوي البيانات على أكثر من 100 ألف رسالة ، وهذا يعني ملايين المساهمات. جودة البيانات تتجاوز ما توقعوه على الإطلاق - معظم المساهمات عالية الجودة. الآن ، يقومون بتصدير V1 من مجموعة البيانات. كما قيل ، إنهم يتدربون حاليًا على الدفعة الأولية من النماذج.
  - 11 مارس 2023: سيتم إطلاق مجموعة بيانات التعليم المفتوح (OIG). OIG عبارة عن مجموعة بيانات تعليمات كبيرة مفتوحة المصدر تحتوي حاليًا على تعليمات 43 متر تقريبًا.
    OIG هي واحدة من العديد من مجموعات بيانات chatbot التي سيصدرها Laion ، إلى جانب متطوعوها ، OnTocord ، معًا وأعضاء الآخرين في مجتمع المصدر المفتوح ، ويهدف إلى خلق وصول متساوٍ إلى تقنية chatbot. الجميع مدعوون لاستخدام مجموعة البيانات والمساهمة في التحسينات عليها.
    ترتبط مجموعة بيانات OIG بمشروع مساعد Laion المفتوح.
  - 9 مارس 2023: طراز SFT-1 12B للمساعدة المفتوحة-النموذج الأولي المبكر لنموذج النقل الإنجليزي الخاضع للإشراف (SFT) للمشروع المفتوح. إنه يعتمد على Pythia 12b تم ضبطه على المظاهرات البشرية البالغة 22 ألفًا من المحادثات المساعدين التي تم جمعها قبل 7 مارس 2023. جرب: Aggingface Space (سهل وسريع ، chatbot chatbot ui) ، Google Collab. إليك دليل حول كيفية تشغيل النموذج محليًا على جهاز الكمبيوتر الخاص بك باستخدام وحدة معالجة الرسومات.
  - 23 مارس 2023: بدأ هذا المشروع في التشكيل بشكل جيد. النموذج قادم.
    - يمكن أن رمز نموذج SFT-1 12B المساعد. تبدو مثيرة للاهتمام ومثيرة للاهتمام ، إذا قارناها ضد GPT-3.5.
    - لدينا حتى Reddit Bot غير رسمي على الهواء مباشرة على /r/ask_open_assistant . شفرة
  - 15 أبريل 2023: OpenAssistant هو رسميا! يتضمن الإصدار نماذج ومجموعات البيانات وواجهة الدردشة. [إعلان فيديو ، جرب ، نماذج]
    - محادثات OpenAssistant - إضفاء الطابع الديمقراطي على محاذاة نموذج اللغة الكبيرة (ورقة) ، 2023.
    - هناك نماذج مختلفة متوفرة بما في ذلك النماذج القائمة على لاما والبيثيا.
    - مجموعة بيانات المحادثة (OASST1) التي تم إصدارها تحت Apache 2.0. تتضمن مجموعة البيانات 161،443 رسالة ، و 66،497 شجرة محادثة ، و 35 لغة مختلفة ، وتم إنشاؤها من قبل 13500 متطوع. إصدار مجموعة البيانات هذا أمر كبير.
- رديت
ملاحظة: يرجى الاطلاع على Github Repo للحصول على معلومات محدثة.
Carperai/Trlx
- نشأت كشوكة TRL.
- يتيح لك أن تعانق نماذج لغة الوجه (GPT2 ، GPT-NEOX على أساس معلمات ما يصل إلى 20B باستخدام التعلم التعزيز من التعليقات البشرية (RLHF).
- أحضرها لك كاربياي (مختبر إليوتراي). لقد أعلنوا عن خطط لأول LM. بدأ Carperai بتطوير أدوات RLHF مفتوحة المصدر جاهزة. [تغريدة والفيديو]
الأخبار (2023-01-13): قاموا بتكرار تعلم Openai لتلخيص الورق باستخدام مكتبة TRLX. [تقرير]
LucidRains/Palm-RLHF-Pytorch-(WIP) تنفيذ RLHF أعلى بنية النخيل. في الأساس chatgpt ولكن مع النخيل. يخطط المطور لإضافة وظائف الاسترجاع أيضًا ، à la retro. [سقسقة]
2023: شيء مضحك في الأسئلة الشائعة:
لا يوجد نموذج مدرب. هذه مجرد سفينة وخريطة شاملة. ما زلنا نحتاج إلى ملايين الدولارات من بيانات Compute + للإبحار إلى النقطة الصحيحة في مساحة المعلمة عالية الأبعاد. وحتى مع ذلك ، فأنت بحاجة إلى البحارة المحترفين (مثل روبن رومباخ من شهرة الانتشار المستقر) لتوجيه السفينة بالفعل خلال أوقات مضطربة إلى تلك النقطة.
الأخبار (2022-12-31): يوجد الآن بديل مفتوح المصدر لـ ChatGpt ، ولكن حظًا سعيدًا في تشغيله-تعليقاتي: لا لم يفعل ذلك. هذا ليس نموذجًا فعليًا مدربًا (بدون أوزان) يمكنك استخدامه. هذا مجرد رمز لتدريب نموذج يشبه ChatGPT. علاوة على ذلك ، فإن بيانات التدريب (ENWIK8) صغيرة.
سيصدر قطار Carperai واسع النطاق RLHF (TRLX) مع بيانات Laion في أوائل العام المقبل. (المصدر: تغريدة)
Allenai/RL4LMS - RL لنماذج اللغة (RL4LMS) بواسطة Allen AI. إنها مكتبة RL معيارية لضبط نماذج اللغة لتفضيلات الإنسان.
GPT-JT بواسطة Computer Research Computer معًا هو مثال يوزع التدريب النموذجي على موزع جغرافي لأجهزة الكمبيوتر المتنوعة (و GPU). GPT-JT (6B) هو متشعب متغير من GPT-J من Eleutherai ، ويؤدي بشكل جيد بشكل استثنائي تصنيف النص والمهام الأخرى. على معايير التصنيف مثل الطوافة ، فإنها تقترب من النماذج الحديثة التي تكون أكبر بكثير (على سبيل المثال ، addructgpt Davinci v2)! [ورقة: التدريب اللامركزي لنماذج الأساس في البيئات غير المتجانسة (2022)]
LEAM (نماذج كبيرة من الذكاء الاصطناعي)-يخطط الاتحاد الأوروبي لتمويل تطوير نموذج يشبه ChatGPT واسع النطاق. [موقع الويب ، وثائق المشروع (الإنجليزية ، PDF) ، ورقة المفاهيم (الألمانية ، PDF)]
/r/aicrowdfund - بدأ مكان للتو (2023) حيث يمكن للناس إيجاد طريقة لصندوق الحشد (مع وحدات معالجة الرسومات) من الذكاء الاصطناعي. لست متأكدًا مما إذا كانت قد شاهدت بتلات حيث يمكنك تشغيل LLMS في المنزل ، على طراز BitTorrent (التعلم الموحّد؟). يبدو أنه يتجه في هذا الاتجاه.
حلول المصدر مفتوحًا يكرر عملية تدريب ChatGPT-فهي تقدم عملية تنفيذ مكافئة مع مكافئة ChatGPT منخفضة المصدر ، بما في ذلك:
- عملية تدريب تجريبية مصغرة للمستخدمين للعب حولها ، والتي تتطلب فقط 1.62 جيجابايت من ذاكرة GPU وربما يتم تحقيقها على وحدة معالجة الرسومات الواحدة على مستوى المستهلك ، مع نمو ما يصل إلى 10.3x في سعة نموذج واحد على وحدة معالجة الرسومات.
- عملية تنفيذ مكافئة في Pytorch الكاملة القائمة على Pytorch.
- بالمقارنة مع Pytorch الأصلي ، يمكن أن تكون عملية تدريب الآلة المفردة أسرع 7.73 مرة ويمكن أن يكون الاستدلال أحادي GPU أسرع 1.42 مرة.
- github repo: https://github.com/hpcaitech/colossalai
لقد حصلت على انطباع بأن نقطة المقالة هي توصيل إطار عملهم والمنتج الهائل ، ومجموعة من المكونات المتوازية والأدوات والأدوات الصلبة للنماذج الكبيرة. بصراحة ، تبدو أعدادهم مشبوهة بالنسبة لي ، إلا إذا فاتني شيء ما. ما يجعل ChatGPT مثيرة للاهتمام (أكثر من GPT-3) هو عملية RLHF. إنهم يدعون لتكرار عملية RLHF تمامًا. ولكن المقالة تلمس برفق حول تنفيذ RLHF. يقومون بتدريب RLHF باستخدام مجموعات بيانات مثال على ذلك مثال. يتم إخفاء تفاصيل تنفيذ RLHF الخاصة بهم هنا: https://github.com/hpcaitech/colossalai/blob/main/applications/chatgpt. الافتقار إلى العرض التوضيحي لا يلهم الثقة.
Flexgen-تشغيل LLMs مثل OPT-175B/GPT-3 على وحدة معالجة الرسومات الواحدة (على سبيل المثال ، بطاقة ألعاب 16 جيجابايت أو 24 جيجابايت RTX3090). الميزات الرئيسية: 1) ما يصل إلى 100x أسرع من أنظمة التفريغ الأخرى. 2) اضغط على كل من المعلمات وذاكرة التخزين المؤقت للانتباه للنماذج إلى 4 بتات مع فقدان الدقة ضئيلة. 3) توزيع خط الأنابيب التوازي. كما أنها توفر نصًا ونصًا Python والتعليمات التي يمكنك تشغيل chatbot مع نماذج OPT. هذا يجب أن يحل تحديات المتطلبات الحسابية والذاكرة عالية لاستدلال LLM. إن chatbot التي يبنيونها مع نماذج FlexGen و OPT ليست تعليمية (RLHF). لذلك لا يشبه chatbot هذا الدردشة. [الاستدلال التوليدي عالي الإنتاجية لـ LLMs مع وحدة معالجة الرسومات (Paper) ، Stanford et al. ، 2023]
- انهيار وقت التشغيل الاب