このリポジトリは、大規模言語モデルについて学習するために使用するリソースの一部を構成します。また、マイルストーンを含む明確なロードマップは、LLM について適切な方法で学ぶための最良の方法の 1 つであるため、この自己学習の旅を進めるときにロードマップを作成するように努めます。
このために、理論的および実践的な学習リソースを組み合わせて紹介します。
PS:これをもっと視覚的にする必要があります
編集: 2024 年 11 月 6 日
リポジトリを大幅にリファクタリングする必要があります。
関連のないコースやリソースを削除します。
モデル競争では、モデルを追跡するのが難しく、更新により以前のモデルが役に立たなくなるため、リポジトリにモデルをリストし続けることはできません。モデル動物園を組織するためのより良い方法を考える必要があります。
おそらく、1 ~ 2 人の寄稿者を追加するか、リポジトリを開いて寄稿を支援してください。
ノートやチュートリアルをホストしたり、オープンなディスカッションやウェブページを提供したりして、素晴らしい学習体験を提供するにはどうすればよいでしょうか?
CS224N 深層学習による自然言語処理、スタンフォード
自然言語処理スペシャライゼーション、Coursera
ハギングフェイス NLP + トランスフォーマー コース
CS25: トランスフォーマー ユナイテッド V2、スタンフォード CS25、2021 年秋バージョン
Activeloop Learn、この取り組み GenAI360 では、RAG、LLM の微調整、LangChain、VectorDB に関する 3 つの無料コースを提供しています。
Maxime Labonne による LLM コース、ロードマップと Colab ノートブックを使用して大規模言語モデル (LLM) を理解するためのコース。
ハンズオン LLM コース。リアルタイム ファイナンシャル アドバイザー LLM システムのソース コードとビデオと読み物を設計、トレーニング、展開することで、LLM、LLMOps、Vector DB について無料で学びます。
フルスタック ディープ ラーニングは、ディープ ラーニング ブートキャンプとして始まり、2023 年 4 月頃に LLM ブートキャンプに進化し、現在は無料で受講できます。
Cohere による LLM University のこのコースは、わかりやすく視覚的に魅力的な方法で概念を教えることで知られる有名な Luis Serrano が教える 8 つのモジュールで構成されています。このコースには、基礎、展開、セマンティック検索、RAG などのトピックが含まれています。
Deeplearning.ai 短期コース、LLM および生成 AI のさまざまなドメインに関する DL.AI による短期コース。これらの短期コースは、理論的なセッションと実践的なセッションが完璧に融合しているため、非常に役立ちます。コースは通常、Hugging Face、Mistral、OpenAI、Microsoft、Meta、Google などの企業とコラボレーションして作成されます。
DataTalksClub の LLM Zoomcamp、LLM Zoomcamp - Q&A システムの構築に関する無料のオンライン コース。
Aishwarya N Reganti による応用 LLM マスタリー 2024 コース。LLM の基礎、ツールとテクニック、導入と評価から課題と将来の傾向に至るまで、明確なロードマップを備えた 10 週間の無料コースです。
重みとバイアスのコースでは、MLOps、LLM を利用したアプリなどに関するさまざまなコースを提供します。
LLM モデル コース、DataBricks x ed、DataBricks によるプロフェッショナル認定。
Deeplearning.ai は、LLM アプリ開発のための LangChain、AWS Bedrock を使用したサーバーレス LLM、LLM の微調整、セマンティック検索を使用した LLM など、LLM に関するさまざまな短期コースを提供しています。
生成 AI ラーニング パス、Google Cloud の紹介。
Arize University は、llm-evaluation、llm エージェントのツールとチェーン、llm-observability などのコースを主催しています。
Transformers による自然言語処理の本
ラングチェーンのブログ
大規模言語モデルに関する AIMultiple のブログ: 2023 年の完全ガイド
コヒアドキュメント
LangChain と ChatGPT を使用したチャットボットの構築に関する FutureSmart AI ブログ
多様なアプリケーションに GPT-4、Pinecone、LangChain を活用したタスク駆動型自律エージェント
大規模言語モデルの調査 このリポジトリもチェックしてください: https://github.com/RUCAIBox/LLMSurvey
大規模な言語モデルを理解する -- 変革をもたらす読書リスト、セバスティアン・ラシュカ
Wiki CLSP、NLP Reading Group、頻繁に更新される NLP 関連の読書グループのリスト。
ChatGPT の驚くべき可能性の裏話 |グレッグ・ブロックマンテッド
AI はなぜ信じられないほど賢いのか、そして驚くほど愚かなのか |チェ・イェジン |テッド
2023 年 4 月 25 日、アライズ: 観測
2023 年 4 月 27 日、PyTorch 2.0 と ChatGPT を使用した LLM の微調整
H2O組織、HuggingFaces
OpenAssistant 組織、HuggingFaces
DataBricks 組織、HuggingFaces
BigScience Organization、HuggingFaces
EleutherAI 組織、HuggingFaces
NomicAI 組織、HuggingFaces
大脳組織、HuggingFaces
LLMStudio、H2O AI
LLamaインデックス
NeMo Guardrails (NVIDIA) は幻覚を防止し、プログラム可能なガードレールを追加します
MLC LLM、LLM を開発、最適化し、全員のデバイスにネイティブに展開します)
LaMini LLM
ChatGPT、OpenAI、2022 年 11 月 30 日にリリース
Google Bard、2023 年 3 月 21 日にリリース
Tongyi Qianwen AI、アリババ、2023 年 4 月 11 日にリリース
StableLM、安定性 AI、2023 年 4 月 20 日にリリース
アマゾンタイタン
HuggingChat、HuggingFaces、2023 年 4 月 25 日にリリース
H2OGPT
Bloom モデル、RAIL で商用利用可能
GPT-J、EleutherAI、Apache 2.0
GPT-NeoX、EleutherAI、Apache 2.0
GPT4All、NomicAI、MITライセンス
GPT4All-J、NomicAI、MITライセンス
Pythia、EleutherAI、MIT ライセンス
GLM-130B
パーム、グーグル
オプト、メタ
FLAN-T5
LLaMA、メタ
アルパカ、スタンフォード
ビクーニャ、lm-sys
GPTを共有する
松ぼっくり
ウィアビエイト
ミルバス
クロマDB
ベイビーAGI
AutoGPT
LLM に関する最新情報を入手するには、必ずフォローする必要がある人たちです。 LLMの制作・研究・開発に携わる研究者・創業者・開発者・AIコンテンツクリエイター
Sebastian Raschka はレジェンドであり、彼の素晴らしいツイート、ブログ、チュートリアルで LLM バブルを盛り上げてくれるでしょう。 AI の先にある彼のニュースレターを購読する
Andrej Karpathy ということで、このレジェンドは Tesla で働き、休暇をとり、基礎を教えるために YouTube チャンネルを立ち上げ、GPT をゼロから実装する素晴らしいビデオで私たちを驚かせ、最終的に OpenAI に復帰しました。レジェンドを失うことはできないと思います:D
ジェイ・アラマー、そうだ、トランスフォーマーに関する彼の ELI ブログを知らないなら、まずそれを読んで、最新情報を得るために必ず彼をフォローしてください。
Tomaz Bratanic 氏は、有名な書籍「Graph Algorithms for Data Science」の著者であり、現在、GPT、Langchain などに関連する優れたブログを Medium で執筆しています。