法學碩士的生成式人工智慧
在具有大型語言模型 (LLM) 的生成式 AI 中,您將學習生成式 AI 工作原理以及如何將其部署到實際應用程式中的基礎知識。
透過學習本課程,您將學會:
- 深入了解生成式人工智慧,描述典型的基於法學碩士的生成式人工智慧生命週期的關鍵步驟,從資料收集和模型選擇,到效能評估和部署
- 詳細描述為 LLM 提供支援的變壓器架構、它們的訓練方式以及微調如何使 LLM 適應各種特定用例
- 使用經驗縮放定律跨資料集大小、計算預算和推理要求最佳化模型的目標函數
- 應用最先進的訓練、調優、推理、工具和部署方法,在專案的特定限制下最大限度地提高模型的效能
- 聆聽產業研究人員和從業者的故事後,討論產生人工智慧為企業帶來的挑戰和機遇
對法學碩士的工作原理以及培訓和部署法學碩士背後的最佳實踐有良好基礎了解的開發人員將能夠為他們的公司做出正確的決策,並更快地構建工作原型。本課程將支持學習者建立關於如何最好地利用這項令人興奮的新技術的實用直覺。
第一周
生成式 AI 用例、專案生命週期和模型預訓練
學習目標
- 討論模型預訓練以及持續預訓練與微調的價值
- 定義術語「生成式人工智慧」、大型語言模型、提示並描述為法學碩士提供支援的變壓器架構
- 描述典型的基於 LLM 的生成式 AI 模型生命週期中的步驟,並討論在模型生命週期的每個步驟中推動決策的約束因素
- 討論模型預訓練期間的計算挑戰並確定如何有效減少記憶體佔用
- 定義術語「縮放法則」並描述已為法學碩士發現的與訓練資料集大小、計算預算、推理要求和其他因素相關的法則
實驗室 1 - 生成式 AI 用例:總結對話
第一週測驗
第 2 週
微調和評估大型語言模型
學習目標
- 描述使用提示資料集對指令進行微調如何提高一項或多項任務的效能
- 定義災難性遺忘並解釋可用於克服它的技術
- 定義術語參數高效微調 (PEFT)
- 解釋 PEFT 如何降低計算成本並克服災難性遺忘
- 解釋使用提示資料集進行指令微調如何提高一個或多個 LLM 效能
實驗室 2 - 微調對話摘要的生成式 AI 模型
第 2 週測驗
第三週
強化學習和法學碩士支援的應用程序
學習目標
- 描述 RLHF 如何使用人類回饋來提高大型語言模型的效能和一致性
- 解釋如何使用從人類貼標員收集的資料來訓練 RLHF 的獎勵模型
- 定義思維鏈提示並描述如何使用它來提高法學碩士的推理和規劃能力
- 討論法學碩士在知識中斷方面面臨的挑戰,並解釋資訊檢索和增強技術如何克服這些挑戰
實驗室 3 - 透過強化學習微調 FLAN-T5 以產生更積極的摘要
第三週測驗