SmallLanguageModel
1.0.0
此儲存庫包含從頭開始建立您自己的 LLM 所需的所有必要項目。只需按照說明操作即可。受到 Karpathy 的 nanoGPT 和莎士比亞生成器的啟發,我創建了這個儲存庫來建立我自己的法學碩士。它包含從模型資料收集到架構文件、分詞器和訓練文件的所有內容。
該倉庫包含:
在設定 SmallLanguageModel 之前,請確保已安裝以下先決條件:
請依照以下步驟訓練您自己的分詞器或從訓練後的模型產生輸出:
克隆此存儲庫:
git clone https://github.com/shivendrra/SmallLanguageModel-project
cd SLM-clone
安裝依賴項:
pip install requirements.txt
訓練:閱讀training.md以獲取更多資訊。跟著它。
歡迎請求請求。對於重大更改,請先開啟一個問題來討論您想要更改的內容。請確保適當更新測試。
麻省理工學院許可證。查看 License.md 以了解更多資訊。