大規模な言語モデル(LLMS)から始めてください - 無料の専門家になりましょう!
フィールドの高度なバックグラウンドなしで2024年にLLMスキルを開始および改善するための完全なガイド。
まず、プログラミングまたはAIの知識が0個の場合は、この正確な目的のために作成したこのガイドに従って、ここに戻ってください!
このガイドは、プログラミングと機械学習の背景が少ない人を対象としています。従うべき具体的な順序はありませんが、古典的なパスは上から下にあります。本を読むのが嫌いなら、それらをスキップしてください。オンラインコースをフォローしたくない場合は、スキップすることもできます。機械学習の専門家になるための単一の方法はありません。やる気があれば、絶対に達成することができます。
ここにリストされているすべてのリソースは無料ですが、いくつかのオンラインコースや本を除いて、それは確かにより良い理解のために推奨されますが、オンラインの読み、ビデオ、練習にもう少し時間を費やして、それらのない専門家になることは間違いありません。コースの支払いに関しては、このガイドのリンクは関連リンクです。コースをフォローしたいと思うなら、それらを使用してください。ありがとう、そして楽しい学習をしてください!覚えておいてください、これは完全にあなた次第であり、必要ではありません。それは私にとって有用であり、おそらく他の人にも役に立つと感じました。
ビデオを繰り返したり、複数のソースから学ぶことを恐れないでください。繰り返しは学習の成功の鍵です!
メンテナー:LouisfB01、YouTubeでも、AI&LLMSについて詳しく見たい/聞きたい場合もポッドキャスターとしてアクティブ!私の個人的なニュースレターで、週に2回詳しく学ぶこともできます!
このリポジトリに追加するための優れたリソースの問題を自由に送信してください。
リストを共有している場合は、Twitter @whats_aiまたはlinkedin @louis bouchardで私にタグを付けてください!
このガイドが何であるかを知りたいですか?このビデオを見る:
目次
- 前提条件
- 最初のステップとしての短いYouTubeビデオの紹介から始める
- LLMの本と記事(読者向け)
- オンラインコースをフォローしてください
- 練習、練習、練習!
- プロンプト
- 検索拡張生成(RAG)
- より多くのリソース(コミュニティ、チートシート、ニュースなど!)
- 機械学習の仕事を見つける方法
- AI倫理
- 詳細を学び、LLMSでもっとやります
前提条件
プログラミングまたはAIの知識が0の場合は、この正確な目的のために作成したこのガイドに従ってください。 Pythonセクションをほとんどチェックしてみると、ここに戻るのに十分な強力な背景ができます!
あなたがPythonとAIに多少精通しているなら、私はあなたに幸せな学習を願っています!
最初のステップとしての短いYouTubeビデオの紹介から始める
短いYouTubeビデオの紹介から始めてください
これは、何もないところから始めるための最良の方法です。ここでは、LLMフィールドで開始するために知っておくべき用語の素晴らしい最初の紹介を提供することがわかった最高のビデオのいくつかをリストします。
- 用語を理解する
- AI Jargonのマスター - Openai&LLM用語のガイド-Louis Bouchard- LLM(またはGPT)の世界で最も使用されている用語をすばやく紹介します。
- トランスとLLMSの理解(つまり、ChatGPTの背後にあるモデル)!
- 大規模な言語モデルへのイントロ - アンドレジ・カルパシーからの驚くべき1時間の講演。
- 自然言語処理と大規模な言語モデル - 注意メカニズム、トークン、埋め込みなどの驚くべきビデオ紹介。GPTのような大規模な言語モデルの背後にあるすべてをよりよく理解してください。
- トランスモデルとは何ですか?それらはどのように機能しますか? - ルイス・セラーノ
- 図解Word2vec-機械学習における単語埋め込みの穏やかな紹介 - Jay Alammarによる機械学習における単語埋め込みの明確な説明。
- 言語モデルのハッカーガイド - ジェレミーハワード(fast.ai)。
- GPTを構築しましょう:ゼロから、コードで、綴られます。 -Andrej Karpathyによる。
開始して学習を続けるもう1つの簡単な方法は、暇なときにポッドキャストを聴くことです。職場に運転したり、バスで運転したり、眠りにつくのに苦労していますか?いくつかのAIポッドキャストを聞いて、用語やパターンに慣れ、感動的なストーリーを通してフィールドについて学びましょう! Lex Fridman、Machine Learning Street Talk、そして明らかに私のポッドキャスト:Louis Bouchard Podcastのように、私が個人的に好むいくつかの最高のいくつかをフォローすることを勧めます。私が最新の状態で私を聴いて本当に楽しんでいる新しいものは、友人のアレックス・フォルコフによるThursdaiポッドキャストです。
YouTubeで利用できる素晴らしいコースのリストは、間違いなく100%無料である必要があります。
- Louis BouchardのLLM Free Course Videos「Aciveloopによる生産コース用のTrain&Tune LLMS、AI&Intel Disruptorに向けて」。 「LLMコースのプレイリスト:Gen AI 360:Foundational Model Certification!」
- FreeCodecampによるPython - チュートリアル - を使用して、大規模な言語モデルをゼロから作成します。 「ゼロから独自の大手言語モデルを構築する方法を学びます。このコースは、大規模な言語モデルの背後にあるデータ処理、数学、変圧器に入ります。Pythonを使用します。」
- CohereのLLM大学(LLMU) - Cohere。 LLM大学(LLMU)は、初心者から上級学習者まで、自然言語加工(NLP)に興味のある人のための包括的な学習リソースのセットです。
- Luis Serranoによる大規模な言語モデルの注意メカニズム。このビデオシリーズでは、ルイスはトランスアーキテクチャがますます深くなっていることを説明しています。これは、変圧器の非常に良い概要と説明であり、すべてのAIの専門家が視聴すべきだと思う注意メカニズムです。
LLMの本と記事(読者向け)
記事と読書パスを好む場合は、ここにいくつかの提案があります。
- 生産用のLLMの構築:AIに向かって、プロンプト、微調整、およびぼろきれによるLLMの能力と信頼性の向上。 「迅速なエンジニアリング、微調整、検索の生成など、大規模な言語モデルを実際のアプリケーションに適応させるための主要な技術スタックを発見してください。」 (または、ここで電子書籍を入手してください。あなたは私をすてきな割引のためにdmすることができます!)
- イラスト付き変圧器 - ジェイアラマーによる。これは、現在の言語モデルがどのように機能するかについての驚くべき説明を提供する有名な記事です。
- LLMSの実用的な紹介-Shawhin Talebiによる。
- メディアは、AIまたはデータサイエンス出版物に向けて、素晴らしい説明を見つけるのに最適な場所です。私もそこで自分の記事を共有しており、プラットフォームを使用するのが大好きです。これがあなたにとって興味深いように聞こえるなら、そしてあなたが私を同時にサポートしたい場合は、ここで私の提携リンクを使用してMediumを購読することができます!
- 新しいMILA学生の読書リスト - 匿名
- 2022年にNLPをマスターするための完全なロードマップ
- NLTKブックは、NLP:https://www.nltk.org/book/の背後にある基本理論について学ぶための無料リソースです
- 注釈付き変圧器 - ハーバード
オンラインコースをフォローしてください
さらにガイダンスが好きなら、(オプション)オンラインコースをチェックアウトすることをお勧めします。
- 大規模な言語モデルを持つ生成AI -Paid
- deeplearning.ai-によるCourseraの自然言語処理の専門を備えたNLP Proになる-Paid
- グラデーションコース - 機械学習モデル用のユーザーインターフェイスを作成-FreeCodeCamp-無料
- Activeloopによる生産コース用のLLMSを列車と微調整、AI&Intel Disruptor -freeに向けて
- CohereによるLLM大学 - 無料
- 初心者から上級LLM開発者まで-AIによる。 「LLMS、プロンプト、ラグ、微調整、エージェントを使用して最初のスケーラブルな製品を構築します!トップ企業が必要とするスキルをマスターし、実際のアプリケーションで独自の高度なLLM MVPを構築します。」
- deeplearning.aiによるCourseraの自然言語処理の専門を備えたNLP Proになります。
- NLPナノ学位! - 有料「最先端の自然言語処理技術を学ぶためのスピーチを処理してテキストを分析してください。隠されたマルコフモデルや再発性ニューラルネットワークなどの確率的で深い学習モデルを構築し、音声認識、機械翻訳などのタスクを実行するようコンピューターに教えてください!」
- Google Cloudを使用した大規模な言語モデルの紹介-Paid
- アプリケーションでLLMをトレーニング、微調整、使用することを学びます。 - ウェイトとバイアスで無料
- セマンティック検索を備えた大規模な言語モデル - 無料、deeplearning.aiおよびcohere
さらに簡単にグーグルでグーグルできますが、それらを読んで見た後、私はあなたがすでにLLMを十分に理解していると信じています。
練習、練習、練習!
練習が重要です
プログラミングで最も重要なことは練習です。これは機械学習にも当てはまります。実践する個人的なプロジェクトを見つけるのは難しいかもしれません。自分で何かを作ろうとすることを強くお勧めしますが、威圧的かもしれないと思います。私が提案するのは、1つまたは2つの非常に適用されたコースに従い、リソースを使用して、彼らが提供するコードの例に基づいて独自のプロジェクトを構築することです。
LLMSで見つけることができる最も適用されるコースのいくつかを以下に示します。
- クイックテキスト分類モデルまたは単語ベクターライザーの構築を目指して、FastTextはモデルをすばやく訓練するのに適したライブラリです。
- Huggingfaceは、現代のNLPモデルを入手する場所であり、それに関する全コースも含まれています。
- Langchain&Vector Databases in Production -ActeloopおよびIntel Disruptorイニシアチブと協力してAIに向けて構築した驚くべき無料リソースは、生産におけるLangchain&Vectorデータベースについて学びます。 「あなたがAIの領域の新人であろうと経験豊富な機械学習愛好家である経験豊富な開発者であろうと、このコースはあなたのために設計されています。私たちの目標は、AIをアクセスしやすく実用的にし、毎日のタスクと仕事の全体的な影響にどのようにアプローチするかを変えることです。」
- 生産用のトレーニングと微調整LLM- AciveloopおよびIntel Disruptor InitiativeとのパートナーシップでAIに向けて構築した驚くべき無料リソースと、生産用のトレーニングと微調整LLMSについて学びます。 「LLMSをゼロからトレーニングおよび微調整する方法を学び、中程度のPythonの知識と中程度のコンピューティングリソースへのアクセス(場合によっては、Google Colabだけで十分です!)を学びたい場合、このコースは、AI、現在の機械学習エンジニアの初心者、学生、およびキャリアを提供する職業を提供する職業を提供する職業を提供する職業を含む職業を含む、幅広い視聴者とともに設計されています。 AIをよりアクセスしやすく実用的にするために、幅広い産業の大規模な言語モデルを調整します。」
- 現実世界のMLチュートリアルとコミュニティ - 有料
リマインダー。学ぶための最良の方法は、何かを構築することです!私は本当に学ぶ傾向があります。これらのコースはすべて素晴らしいですが、オプションです。自分でそれを行うことができ、ほとんどの企業はLLMS(Openai、Langchain、Activeloop、Cohere、W&B ...)と協力するためのリソースを提供しています。次に、ChatGptにそれを完了するのを手伝ってもらうことができます!
プロンプト
プロンプトは、モデルを使用することとNLP関連アプリの構築の両方で学習するための重要な新しいスキルです。
- 何がプロンプトされていますか? AIモデルと話す...-無料
- 開発者向けのChatGptプロンプトエンジニアリング - 有料
- プロンプトを学ぶ - これは、プロンプトを教え、特定のモデルのヒントを与えることを目的とした素晴らしい無料コースです。それはあなたがプロンプトに必要なすべてです!
- 信頼性を向上させるためのテクニック - プロンプトテクニックに関するOpenai Cookbook。
検索拡張生成(RAG)および微調整の詳細
ほとんどの人は現在、ぼろきらベースのアプリを構築しています。ここに私があなたを始めて、それをよく理解したいと思っていたいくつかのリソースがあります...
- LLMパフォーマンスを最大化するためのテクニックの調査 - 迅速なエンジニアリング、RAG、または微調整をいつ使用するかをカバーするOpenAIによる素晴らしいビデオ。これは、フィールドのすべての人にとって必見です!
- Rag vs微調整vsディープメモリ対トレーニングLLMからゼロ:LLMで何をするか - simlarly、これは、アプリケーションでRag、微調整、または迅速なエンジニアリングを使用する必要がある場合の短いビデオです。
- GPTとEmbeddingsを使用してQ&Aチャットボットを構築します - Jeremy PintoによるYouTubeチュートリアルを適用しました。
- あなたのウェブサイトに関する質問に答えることができるAIを構築する方法 - 無料のOpenaiチュートリアル。
- 初心者から上級LLM開発者まで-AIによる。 「LLMS、プロンプト、ラグ、微調整、エージェントを使用して最初のスケーラブルな製品を構築します!トップ企業が必要とするスキルをマスターし、実際のアプリケーションで独自の高度なLLM MVPを構築します。」
- RAGベースのChatGPT Webアプリの構築方法:新しいAIチューターに会いましょう - YouTubeは、RAGベースのチャットボットの構築方法(およびどのようにできるか)を作成しました。
- 生産用のトレーニングと微調整LLM- LLMSをゼロからトレーニングおよび微調整する方法を学びます。
- Paul Iusztin、Pau Labarta Bajo、Alexandru Razvantによるリアルタイムのファイナンシャルアドバイザー - ハンズオンLLMSコースを訓練および展開します。
- Langchain&Llamaindexでの生産のための検索拡張生成 - 組織向けのデータアプリケーションとのチャットを構築することを計画している場合、またはさまざまな業界で生成AIを活用する方法を学ぶかどうか、このコースはあなたのためです。このコースでは、検索精度の向上、AI出力の幻覚の減少、説明可能性の向上、著作権の懸念への対処、よりカスタマイズされた最新のデータ入力の提供など、重要な問題に対処します。基本的なRAGアプリケーションを超えて、Langchain、Llamaindex、Deep Memoryなどのツールを使用して、より複雑で信頼できる製品を作成するスキルを備えています。実践的な学習を強調するこのコースは、現実世界のシナリオで高度なぼろきれのテクニックとアプリケーションをマスターするためのゲートウェイです。
- 生産用のLLMの構築:AIに向かって、プロンプト、微調整、およびぼろきれによるLLMの能力と信頼性の向上。 「迅速なエンジニアリング、微調整、検索の生成など、大規模な言語モデルを実際のアプリケーションに適応させるための主要な技術スタックを発見してください。」 (または、ここで電子書籍を入手してください。あなたは私をすてきな割引のためにdmすることができます!)
より多くのリソース
コミュニティに参加してください!
多くのAI愛好家との不一致サーバー - 一緒に学び、質問をし、Kaggleチームメイトを見つけ、プロジェクトを共有します。
最新のAIニュースを最新の状態に保つことができる不一致サーバー - 最新のAIニュースを最新の状態に保ち、質問をし、プロジェクトを共有してください。
Discord Communityのプロンプトを学ぶ - 仲間のプロンプトエンジニアとチャットします。
Redditコミュニティをフォローしてください - 質問をし、プロジェクトを共有し、ニュースをフォローしてください。
- 人工的な人工知能
- MachineLearning-機械学習(フィールドの最大のsubreddit)
- DeepLearningPapers-ディープラーニングペーパー
- ComputerVision-画像やビデオから有用な情報を抽出します
- LearnMachineLearning-機械学習を学びます
- 人工能力-AI
- latsestinml-機械学習におけるゲームを変える開発は見逃すべきではありません
フィールドのニュースに従ってください!
機械学習の仕事を見つけてください
- インタビューのヒントとそれらの準備方法でいっぱいの記事からこのセクションを読んでください。
- Nvidia、Zoox(自動運転会社)、D-ID(生成AIスタートアップ)などの専門家と一緒に行ったインタビューシリーズのように、インタビュープロセスがどのように他の人がそれをしたかを見ることで、彼らの準備を改善する方法を学びます。
AI倫理
- 倫理とは何ですか、そしてなぜ彼らは重要なのですか?機械学習版 - fast.aiの創設者であるレイチェルトーマスによる
- ai4people - 優れたAI社会のための倫理的枠組み:機会、リスク、原則、推奨事項-Floridi et al。、2018、AI4People AIの良い社会のAI
- 信頼できるAIのための倫理ガイドライン - 欧州委員会の信頼できるAIのための高レベルの専門家グループ7ポイント。
- ロボティクスとAIの倫理の紹介 - クリストフ・バートネック、クリストフ・リュッジ、アラン・ワグナー、ショーン・ウェールズによる無料の電子書籍。
詳細を学び、LLMSでもっとやります
ChatGpt、Bing、Claude ...は信じられないほどです。もちろん、制限があります。しかし、あなたはそれらを活用してあなたが望むものを何でも学ぶことができます。私はそれを使用して、一般的に多くの質問をコーディングしたり、多くの質問をしたりします。重要な質問をするときは、ダブルチェックする必要があります。それでも、それは強力なツールです。はい、それはツールであり、人間の代替品ではありません。ほとんどすべてを知っている愚かなアシスタントとして使用してください。
私がよく知られていないプロジェクトの機能をよりよく理解するために、プロジェクトにどのように使用したかの明確な例を示します。これはPython向けですが、これらのモデルは一般的にコーディングに非常に強力であり、新しいプラットフォーム(AWS、GCP、仮想マシン、サーバー、SSH接続などの作業などを理解しています。
PS私はビンとクロードについて楽しみについて言及しませんでした。 Openaiのような単一の会社に過度に依存してはいけません。最高のLLMのための戦いには他の企業がいます(そして常にそうなるでしょう)。今朝のガイドの例を作成したかったのですが...
リストを共有している場合は、Twitter @whats_aiまたはlinkedin @louis bouchardで私にタグを付けてください!
?私の仕事をサポートしたい場合は、このリポジトリのスポンサーを確認したり、Patreonで私をサポートしたりできます。
このガイドはまだ定期的に更新されています。