SmallLanguageModel
1.0.0
このリポジトリには、独自の LLM を最初から構築するために必要なすべてのアイテムが含まれています。指示に従ってください。 Karpathy の nanoGPT と Shakespeare ジェネレーターからインスピレーションを得て、独自の LLM を構築するためにこのリポジトリを作成しました。モデルのデータ収集からアーキテクチャ ファイル、トークナイザー、トレイン ファイルまですべてが含まれています。
このリポジトリには次のものが含まれます。
SmallLanguageModel を設定する前に、次の前提条件がインストールされていることを確認してください。
次の手順に従って、独自のトークナイザーをトレーニングするか、トレーニングされたモデルから出力を生成します。
このリポジトリのクローンを作成します。
git clone https://github.com/shivendrra/SmallLanguageModel-project
cd SLM-clone
依存関係をインストールします。
pip install requirements.txt
トレーニング: 詳細については、training.md をお読みください。それに従ってください。
プルリクエストは大歓迎です。大きな変更の場合は、まず問題を開いて、変更したい内容について話し合ってください。必要に応じてテストを更新してください。
MITライセンス。詳細については、License.md を確認してください。