SmallLanguageModel
1.0.0
该存储库包含从头开始构建您自己的 LLM 所需的所有必要项目。只需按照说明操作即可。受到 Karpathy 的 nanoGPT 和莎士比亚生成器的启发,我创建了这个存储库来构建我自己的法学硕士。它包含从模型数据收集到架构文件、分词器和训练文件的所有内容。
该仓库包含:
在设置 SmallLanguageModel 之前,请确保已安装以下先决条件:
请按照以下步骤训练您自己的分词器或从训练后的模型生成输出:
克隆此存储库:
git clone https://github.com/shivendrra/SmallLanguageModel-project
cd SLM-clone
安装依赖项:
pip install requirements.txt
训练:阅读training.md以获取更多信息。跟着它。
欢迎请求请求。对于重大更改,请先打开一个问题来讨论您想要更改的内容。请确保适当更新测试。
麻省理工学院许可证。查看 License.md 了解更多信息。