ابدأ بنماذج اللغة الكبيرة (LLMS) - كن خبيرًا مجانًا!
دليل كامل للبدء وتحسين مهارات LLM الخاصة بك في عام 2024 دون وجود خلفية متقدمة في هذا المجال والبقاء على اطلاع بأحدث الأخبار والتقنيات الحديثة!
أولاً ، إذا كان لديك 0 برمجة أو معرفة منظمة العفو الدولية ، فيرجى اتباع هذا الدليل الذي أدخلته لهذا الغرض الدقيق والعودة إلى هنا!
هذا الدليل مخصص لأي شخص لديه خلفية صغيرة في البرمجة والتعلم الآلي. لا يوجد ترتيب محدد لمتابعة ، ولكن المسار الكلاسيكي سيكون من أعلى إلى أسفل. إذا كنت لا تحب قراءة الكتب ، تخطيها. إذا كنت لا ترغب في متابعة دورة عبر الإنترنت ، فيمكنك أيضًا تخطيها. لا توجد طريقة واحدة لتصبح خبيرًا في التعلم الآلي ، ومع الدافع ، يمكنك تحقيق ذلك تمامًا.
جميع الموارد المدرجة هنا مجانية ، باستثناء بعض الدورات والكتب عبر الإنترنت ، والتي يوصى بها بالتأكيد لفهم أفضل ، ولكن من الممكن بالتأكيد أن تصبح خبيرًا بدونها ، مع قضاء المزيد من الوقت في القراءات ومقاطع الفيديو والممارسة عبر الإنترنت. عندما يتعلق الأمر بالدفع دورات ، فإن الروابط الواردة في هذا الدليل هي روابط تابعة. يرجى استخدامها إذا كنت تشعر باتباع دورة ، لأنها ستدعمني. شكرا لك ، واستمتع بالتعلم! تذكر أن هذا متروك لك تمامًا وليس ضروريًا. شعرت أنه كان مفيدًا بالنسبة لي وربما مفيدًا للآخرين أيضًا.
لا تخف من تكرار مقاطع الفيديو أو التعلم من مصادر متعددة. التكرار هو مفتاح النجاح في التعلم!
المشرف: Loufisfb01 ، نشط أيضًا على YouTube وكمدة podcaster إذا كنت ترغب في رؤية/تسمع المزيد عن AI & LLMS! يمكنك أيضًا معرفة المزيد مرتين في الأسبوع في رسالتي الإخبارية الشخصية!
لا تتردد في تقديم مشكلة لأي موارد رائعة لإضافتها إلى هذا المستودع.
ضع علامة على twitter @whats_ai أو linkedIn @louis bouchard إذا كنت تشارك القائمة!
تريد أن تعرف ما الذي يدور حوله هذا الدليل؟ شاهد هذا الفيديو:
جدول المحتويات
- prerequesites
- ابدأ بمقدمات فيديو قصيرة على YouTube كخطوة أولى
- كتب ومقالات LLM (للقراء)
- اتبع دورات عبر الإنترنت
- الممارسة والممارسة والممارسة!
- المطالبة
- الجيل المعزز للاسترجاع (خرقة)
- المزيد من الموارد (المجتمعات ، أوراق الغش ، الأخبار ، وأكثر من ذلك!)
- كيفية العثور على وظيفة التعلم الآلي
- أخلاقيات الذكاء الاصطناعي
- تعرف على المزيد وافعل المزيد ... مع LLMS
prerequesites
إذا كان لديك 0 برمجة أو معرفة منظمة العفو الدولية ، فيرجى اتباع هذا الدليل الذي أدخلته لهذا الغرض بالضبط. تحقق من قسم Python في الغالب وبعد ذلك سيكون لديك خلفية قوية بما يكفي للعودة إلى هنا!
إذا كنت معتادًا إلى حد ما على Python و AI ، فأتمنى لك التعلم السعيد!
ابدأ بمقدمات فيديو قصيرة على YouTube كخطوة أولى
ابدأ بمقدمة مقاطع فيديو قصيرة على YouTube
هذه هي أفضل طريقة للبدء من لا شيء. هنا ، أدرج بعضًا من أفضل مقاطع الفيديو التي وجدتها والتي ستمنحك مقدمة أولى رائعة للشروط التي تحتاج إلى معرفتها للبدء في حقل LLM.
- فهم المصطلحات
- إتقان Jargon AI - دليلك إلى Openai & LLM Trans - Louis Bouchard - مقدمة سريعة للمصطلحات الأكثر استخدامًا في عالم LLM (أو GPT).
- فهم المحولات و LLMS (أي نماذج خلف ChatGPT)!
- مقدمة لنماذج اللغة الكبيرة - حديث مدهش مدته ساعة واحدة من Andrej Karpathy.
- معالجة اللغة الطبيعية ونماذج اللغة الكبيرة - مقدمات فيديو مذهلة لآلية الانتباه ، الرموز ، التضمينات والمزيد لفهم كل شيء وراء نماذج اللغة الكبيرة مثل GPT بواسطة Luis Serrano.
- ما هي نماذج المحولات وكيف تعمل؟ - لويس سيرانو
- Word2Vec المصور - مقدمة لطيفة لتوضيحات الكلمات في التعلم الآلي - شرح واضح لتضمينات الكلمات في التعلم الآلي بواسطة Jay Alammar.
- دليل المتسللين لنماذج اللغة - بقلم جيريمي هوارد (fast.ai).
- دعنا نبني GPT: من الصفر ، في الكود ، تم تهجئتها. - بقلم أندريج كارباشي.
هناك طريقة أخرى سهلة للبدء والاستمرار في التعلم وهي الاستماع إلى البودكاست في أوقات فراغك. القيادة إلى العمل ، أو في الحافلة ، أو تواجه مشكلة في النوم؟ استمع إلى بعض بودكاست AI للتعود على المصطلحات والأنماط ، والتعرف على الحقل من خلال القصص الملهمة! أدعوكم إلى اتباع بعض من أفضل أفضل ما أفضّله شخصياً ، مثل Lex Fridman ، و Machine Learning Street Talk ، ومن الواضح أن بودكاست الخاص بي: لويس بوشارد بودكاست ، حيث ستتعرف على الأشخاص الموهوبين بشكل لا يصدق في هذا المجال مع قصص ملهمة تشترك في المعرفة التي عملوا بجد لجمعها. واحدة جديدة أستمتع بها حقًا والتي تبقيني على اطلاع دائم هو بودكاست الخميس من قبل صديقي أليكس فولكوف.
فيما يلي قائمة بالدورات التدريبية الرائعة المتوفرة على YouTube التي يجب عليك متابعتها بالتأكيد وهي مجانية بنسبة 100 ٪.
- مقاطع الفيديو المجانية لويس بوتشارد LLM "Train & Fine-Tune LLMs لدورة الإنتاج بواسطة Activeloop ، نحو AI & Intel Disruptor". "قائمة تشغيل لدورة LLM الخاصة بنا: Gen AI 360: شهادة النموذج التأسيسي!"
- قم بإنشاء نموذج لغة كبير من نقطة الصفر مع Python - البرنامج التعليمي - بواسطة FreeCodecamp. "تعلم كيفية بناء نموذج اللغة الكبير الخاص بك ، من نقطة الصفر. هذه الدورة تنتقل إلى معالجة البيانات والرياضيات والمحولات وراء نماذج اللغة الكبيرة. ستستخدم Python."
- جامعة LLM (LLMU) من Cohere - بواسطة Cohere. جامعة LLM (LLMU) هي مجموعة من موارد التعلم الشاملة لأي شخص مهتم بمعالجة اللغة الطبيعية (NLP) ، من المبتدئين إلى المتعلمين المتقدمين.
- آلية الانتباه في نماذج اللغة الكبيرة - بقلم لويس سيرانو. في سلسلة الفيديو هذه ، يشرح لويس بنية المحولات بشكل متزايد بعمق. إنها نظرة عامة جيدة جدًا وشرح للمحولات وآلية الانتباه التي أعتقد أنه ينبغي مراقبتها من قبل جميع المتخصصين في الذكاء الاصطناعي.
كتب ومقالات LLM (للقراء)
إذا كنت تفضل المقالة ومسار القراءة ، فإليك بعض الاقتراحات:
- بناء LLMS للإنتاج: تعزيز قدرات LLM والموثوقية مع المطالبة ، والضبط ، والخرقة - نحو AI. "اكتشف مداخن التكنولوجيا الرئيسية لتكييف نماذج اللغة الكبيرة للتطبيقات الواقعية ، بما في ذلك الهندسة الفورية ، والضبط ، وزيادة استرجاع التوليد." (أو احصل على الكتاب الإلكتروني هنا. يمكنك DM لي للحصول على خصم جيد!)
- المحول المصور - بقلم جاي ألام. هذا مقال مشهور يقدم شرحًا رائعًا لكيفية عمل نماذج اللغة الحالية.
- مقدمة عملية إلى LLMS - بقلم شوهين تالبي.
- يعد Medium أفضل مكان لإيجاد تفسيرات رائعة ، إما نحو AI أو نحو منشورات علوم البيانات. أشارك أيضًا مقالاتي الخاصة هناك وأحب استخدام النظام الأساسي. يمكنك الاشتراك في المتوسطة باستخدام الرابط التابع الخاص بي هنا إذا كان هذا يبدو مثيرًا للاهتمام بالنسبة لك وإذا كنت ترغب في دعمني في نفس الوقت!
- قوائم القراءة لطلاب ميلا جدد - مجهول
- خريطة طريق كاملة لإتقان NLP في عام 2022
- NLTK Book هو المورد المجاني للتعرف على النظريات الأساسية وراء NLP: https://www.nltk.org/book/
- المحول المشروح - هارفارد
اتبع دورات عبر الإنترنت
إذا كنت تحب المزيد من التوجيهات ، يمكنني أن أنصح بالتحقق من الدورات التدريبية عبر الإنترنت (اختيارية) ، مثل ...
- AI التوليدي مع نماذج لغة كبيرة - مدفوعة
- كن NLP Pro مع تخصص معالجة اللغة الطبيعية في Coursera من قبل Deeplearning.ai - دفعت
- دورة Gradio - إنشاء واجهات مستخدم لنماذج التعلم الآلي - FreeCodecamp - مجاني
- Train & Fine -Tune LLMS لدورة الإنتاج بواسطة Activeloop ، نحو AI & Intel Disruptor - مجانًا
- جامعة LLM بواسطة Cohere - Free
- من المبتدئين إلى مطور LLM المتقدم - من نحو AI. "قم ببناء أول منتج قابل للتطوير مع LLMs ، و PROMPTING ، و RAT ، والضبط ، والوكلاء! إتقان المهارات التي تحتاجها الشركات الكبرى وإنشاء LLM MVP المتقدمة الخاصة بك مع تطبيقات العالم الحقيقي."
- كن NLP Pro مع تخصص معالجة اللغة الطبيعية في Coursera من قِبل Deeplearning.ai-دفعت "اقتحام مساحة NLP. تقنيات NLP المتطورة من خلال أربع دورات عملية!"
- درجة نانو NLP! -مدفوعة الأجر "تعلم تقنيات معالجة اللغة الطبيعية المتطورة لمعالجة الكلام وتحليل النص. بناء نماذج التعلم الاحتمالي والعميق ، مثل نماذج ماركوف المخفية والشبكات العصبية المتكررة ، لتعليم الكمبيوتر القيام بمهام مثل التعرف على الكلام ، والترجمة الآلية ، وأكثر!"
- مقدمة لنماذج اللغة الكبيرة مع Google Cloud - مدفوعة الأجر
- تعلم التدريب ، وضبطها واستخدام LLMs في تطبيقاتك. - حر حسب الأوزان والتحيزات
- نماذج لغة كبيرة مع بحث دلالي - مجاني ، deeplearning.ai و coher
يمكنك بسهولة Google للمزيد ، ولكن بعد قراءة ومشاهدة هؤلاء ، أعتقد أن لديك بالفعل فهم جيد بما فيه الكفاية لـ LLMs للدخول في الصفقة الحقيقية: الممارسة.
الممارسة والممارسة والممارسة!
الممارسة هي المفتاح
أهم شيء في البرمجة هو الممارسة. هذا ينطبق على التعلم الآلي أيضا. قد يكون من الصعب العثور على مشروع شخصي لممارسة. أنصحك بشدة بمحاولة بناء شيء بنفسك ، لكنني أفهم أنه قد يكون مخيفًا. ما أقترحه بعد ذلك هو اتباع دورتين أو دورتين مطبقتين للغاية واستخدام المورد لإنشاء مشروعك الخاص استنادًا إلى أمثلة التعليمات البرمجية التي توفرها لك ، و chatgpt أو github copilot للعمل لك كمساعد رمز لبقية العمل.
فيما يلي بعض الدورات الأكثر تطبقًا التي يمكن أن أجده لـ LLMS:
- تتطلع FastText إلى إنشاء نموذج سريع لتصنيف النص أو Word Vectorizer ، يعد مكتبة جيدة لتدريب النموذج بسرعة.
- Huggingface هو المكان المناسب للحصول على نماذج NLP الحديثة ، كما أنها تشمل دورة كاملة حول هذا الموضوع.
- قواعد بيانات Langchain & Vector في الإنتاج - مورد مجاني مدهش قمنا ببنيه نحو الذكاء الاصطناعي بالشراكة مع Activeloop ومبادرة Intel Disruptor للتعرف على قواعد بيانات Langchain & Vector في الإنتاج. "سواء كنت مطورًا متمرسًا ، وهو قادم جديد في عالم الذكاء الاصطناعي أو عشاق التعلم الآلي ذي الخبرة ، فإن هذه الدورة مصممة لك. هدفنا هو جعل منظمة العفو الدولية متاحة وعملية ، مما يحول كيف تتعامل مع المهام اليومية والتأثير الكلي لعملك."
- Training & Tuning LLMS للإنتاج-مورد مجاني مدهش قمنا ببنيه نحو الذكاء الاصطناعى بالشراكة مع Activeloop ومبادرة Intel Disruptor للتعرف على التدريب والضرب LLMs للإنتاج. "إذا كنت تريد أن تتعلم كيفية تدريب LLMs وضبطها من نقطة الصفر ولديك المعرفة المتوسطة Python بالإضافة إلى الوصول إلى موارد حساب معتدلة (لبعض الحالات ، فإن Google Colab فقط ستعمل على ما يكفي!) ، يجب أن تكون مستعدًا جميعًا للاستمتاع بالمسار والاستكمال مع الأدوات المهنية مع الأدوات المهنية لتطبيقها مع الأدوات المتعلقة بالوظيفة. تخصيص نماذج لغة كبيرة عبر مجموعة واسعة من الصناعات لجعل الذكاء الاصطناعي أكثر سهولة وعملية. "
- تعليمي ومجتمع ML في العالم الحقيقي - مدفوع الأجر
تذكير. أفضل طريقة للتعلم هي بناء شيء ما! أنا حقا عرضة للتعلم من خلال العمل. هذه الدورات كلها رائعة ولكن اختيارية. يمكنك القيام بذلك بمفردك ، ومعظم الشركات التي توفر الموارد للعمل مع LLMS (Openai ، Langchain ، Activeloop ، Cohere ، W & B ...) لديها برامج تعليمية رائعة لتبدأ وبناء شيء ما. بعد ذلك ، يمكنك أن تطلب من ChatGPT مساعدتك في إنهاءها!
المطالبة
المطالبة هي مهارة جديدة مهمة للتعلم لكل من استخدام النماذج وبناء التطبيقات المتعلقة بـ NLP.
- ما هو المطالبة؟ التحدث مع نماذج الذكاء الاصطناعى ... - مجاني
- chatgpt orgenering للمطورين - مدفوعة الأجر
- تعلم المطالبة - هذه دورة مجانية رائعة تعتزم تعليم المطالبة وتقديم نصائح لنماذج محددة. إنه كل ما تحتاجه للطالب!
- تقنيات لتحسين الموثوقية - كتاب طبخ Openai على التقنيات المطالبة.
المزيد عن الجيل المعزز للاسترجاع (خرقة) وضبط
معظم الناس يبنون تطبيقات القائمة على القطع حاليا. فيما يلي بعض الموارد التي أحببت أن أبدأ بها ولديها فهم جيد لها ...
- دراسة استقصائية للتقنيات لزيادة أداء LLM - فيديو مدهش من قبل Openai الذي يغطي متى يتم استخدام الهندسة المطالبة أو الخرقة أو الضبط الدقيق. هذا أمر لا بد منه للجميع في هذا المجال!
- Rag vs Tuning vs Deep Memory vs Training LLM من نقطة الصفر: متى تفعل ما مع LLMS-Simlarly ، هذا هو مقطع فيديو قصير يغطي عندما يجب أن تستخدم RACN أو TUNTING أو ERGINERANGE في تطبيقاتك.
- بناء Q&A chatbot باستخدام GPT و Embeddings - تم تطبيق برنامج YouTube بواسطة Jeremy Pinto.
- كيفية بناء الذكاء الاصطناعي يمكنه الإجابة على أسئلة حول موقع الويب الخاص بك - البرنامج التعليمي المجاني Openai.
- من المبتدئين إلى مطور LLM المتقدم - من نحو AI. "قم ببناء أول منتج قابل للتطوير مع LLMs ، و PROMPTING ، و RAT ، والضبط ، والوكلاء! إتقان المهارات التي تحتاجها الشركات الكبرى وإنشاء LLM MVP المتقدمة الخاصة بك مع تطبيقات العالم الحقيقي."
- كيفية إنشاء تطبيق ChatGpt على الويب المستند إلى RAG: تعرف على مدرس الذكاء الاصطناعى الجديد-مقدمة YouTube حول كيفية قيامي ببناء chatbot المستند إلى القطع (وكيف يمكنك أيضًا).
- تدريب LLMs للتدريب وضوء الإنتاج-تعلم كيفية تدريب LLMs وضبطه من الصفر.
- تدريب ونشر مستشار مالي في الوقت الفعلي-دورة تدريبية متطورة لـ Paul Iusztin ، Pau Labarta Bajo و Alexandru Razvant.
- استرجاع الجيل المعزز للإنتاج مع Langchain & Llamaindex - سواء كنت تخطط لبناء دردشة مع تطبيق البيانات لمؤسستك أو مجرد تعلم كيفية الاستفادة من الذكاء الاصطناعي في مختلف الصناعات ، فإن هذه الدورة هي لك. تتناول الدورة القضايا الحرجة مثل زيادة دقة الاسترجاع ، وتقليل الهلوسة في مخرجات الذكاء الاصطناعى ، وتعزيز القدرة على التوضيح ، ومعالجة مخاوف حقوق الطبع والنشر ، وتقديم المزيد من مدخلات البيانات المصممة خصيصًا. نتجاوز تطبيقات RAG الأساسية ، ونجمعك بالمهارات اللازمة لإنشاء منتجات أكثر تعقيدًا وموثوقية مع أدوات مثل Langchain و Llamaindex والذاكرة العميقة. مع التأكيد على التعلم العملي ، فإن هذه الدورة هي بوابة لإتقان تقنيات RAG المتقدمة والتطبيقات في سيناريوهات العالم الحقيقي.
- بناء LLMS للإنتاج: تعزيز قدرات LLM والموثوقية مع المطالبة ، والضبط ، والخرقة - نحو AI. "اكتشف مداخن التكنولوجيا الرئيسية لتكييف نماذج اللغة الكبيرة للتطبيقات الواقعية ، بما في ذلك الهندسة الفورية ، والضبط ، وزيادة استرجاع التوليد." (أو احصل على الكتاب الإلكتروني هنا. يمكنك DM لي للحصول على خصم جيد!)
المزيد من الموارد
انضم إلى المجتمعات!
خادم Discord مع العديد من عشاق الذكاء الاصطناعى - تعلم معًا ، وطرح الأسئلة ، والعثور على زملائه في فريق Kaggle ، ومشاركة مشاريعك ، وأكثر من ذلك.
خادم Discord حيث يمكنك البقاء على اطلاع دائم بأحدث أخبار الذكاء الاصطناعى-ابق على اطلاع بأحدث أخبار الذكاء الاصطناعي ، وطرح الأسئلة ، ومشاركة مشاريعك ، وأكثر من ذلك بكثير.
تعلم مجتمع Discord Community - الدردشة مع زملائه المهندسين.
اتبع مجتمعات Reddit - اطرح الأسئلة ، وشارك مشاريعك ، واتبع الأخبار ، والمزيد.
- الاصطناعي - الذكاء الاصطناعي
- MachineleArning - التعلم الآلي (أكبر فرعي في هذا المجال)
- deeplearningpapers - أوراق التعلم العميق
- Computervision - استخراج معلومات مفيدة من الصور ومقاطع الفيديو
- LearnMachinEleaRning - تعلم التعلم الآلي
- الاصطناعي inteligence - الذكاء الاصطناعي
- Latsestinml - التطورات المتغيرة للعبة في التعلم الآلي يجب ألا تفوت
اتبع الأخبار في هذا المجال!
ابحث عن وظيفة التعلم الآلي
- اقرأ هذا القسم من المقالة المليئة بنصائح المقابلة وكيفية الاستعداد لهم .
- تعرف على كيفية تسير عملية المقابلة والتحسن في التحضير لهم من خلال مشاهدة كيفية قيام الآخرين بذلك ، مثل سلسلة المقابلات التي أجرتها مع خبراء من Nvidia ، و Zoox (شركة ذاتية القيادة) ، و D-ID (بدء تشغيل الذكاء الاصطناعي) ، وما إلى ذلك ، إلخ.
أخلاقيات الذكاء الاصطناعي
- ما هي الأخلاق ولماذا يهم؟ طبعة التعلم الآلي - بقلم راشيل توماس ، مؤسس Fast.ai
- Ai4people - إطار أخلاقي لمجتمع الذكاء الاصطناعي الجيد: الفرص والمخاطر والمبادئ والتوصيات - فلوريدي وآخرون ، 2018 ، AI4People AI لمجتمع جيد
- إرشادات الأخلاقيات الخاصة بـ AI الجديرة بالثقة - نقاط الخبراء عالية المستوى من المفوضية الأوروبية من أجل الذكاء الاصطناعى الجدير بالثقة.
- مقدمة عن الأخلاق في الروبوتات و AI - كتاب إلكتروني مجاني لكريستوف بارتنيك ، كريستوف لوت ، آلان فاجنر ، وشون ويلش.
تعرف على المزيد وافعل المزيد ... مع LLMS
Chatgpt ، Bing ، كلود ... لا يصدق. بالطبع ، لديهم قيود. ومع ذلك ، يمكنك الاستفادة من هؤلاء لتعلم أي شيء تريده. أستخدمه لترميز أو طرح الكثير من الأسئلة بشكل عام. تحتاج إلى التحقق المزدوج عند طرح أسئلة مهمة. ومع ذلك ، فهي أداة قوية. نعم ، إنها أداة ، وليس بديلاً بشريًا. استخدمه كمساعد غبي يعرف كل شيء إلى حد كبير.
إليك مثال واضح على كيفية استخدامه لمشروع لفهم وظيفة أفضل من مشروع لم أكن على دراية به. هذا بالنسبة لـ Python ، لكن هذه النماذج قوية للغاية للترميز بشكل عام ، وفهم منصات جديدة (مثل AWS ، و GCP ، والعمل مع جهاز افتراضي ، وخادم ، واتصالات SSH ، وما إلى ذلك .... أي شيء لا تعرفه مفيدًا في مساحة LLM).
ملاحظة: لم أذكر Bing و Claude من أجل المتعة. لا تعتمد بشكل مفرط على شركة واحدة مثل Openai. هناك (وسوف تكون دائمًا) شركات أخرى في الكفاح من أجل أفضل LLM. أردت إنشاء مثال للدليل هذا الصباح عندما ...
ضع علامة على twitter @whats_ai أو linkedIn @louis bouchard إذا كنت تشارك القائمة!
؟ إذا كنت ترغب في دعم عملي ، فيمكنك التحقق من رعاية هذا المستودع أو دعمني على Patreon.
لا يزال هذا الدليل يتم تحديثه بانتظام.