axolotlダウンロード - axolotlソースコードのダウンロード

axolotl

その他のソースコード

v0.5.2

ダウンロード

ウーパールートル

Axolotl は、さまざまな AI モデルの微調整を合理化するように設計されたツールで、複数の構成とアーキテクチャのサポートを提供します。

特徴：

ラマ、ピシア、ファルコン、mpt などのさまざまなハギングフェイスモデルをトレーニングします
fullfinetune、lora、qlora、relora、および gptq をサポート
単純な yaml ファイルまたは CLI 上書きを使用して構成をカスタマイズする
さまざまなデータセット形式をロードしたり、カスタム形式を使用したり、独自のトークン化されたデータセットを使用したりできます
xformer、フラッシュアテンション、ライガーカーネル、ロープスケーリング、マルチパッキングと統合
FSDP または Deepspeed を介して単一 GPU または複数の GPU で動作します
ローカルまたはクラウド上で Docker を簡単に実行
結果とオプションでチェックポイントを wandb、mlflow、または Comet に記録します。
さらに！

ウーパールートル
- 目次
- ウーパールートルのサポート
- クイックスタート ⚡
  - 使用法
- 高度なセットアップ
  - 環境
    - ドッカー
    - コンダ/ピップベンブ
    - クラウドGPU
    - ベアメタルクラウドGPU
      - ラムダラボ
      - GCP
    - 窓
    - マック
    - Googleコラボ
    - SkyPilot 経由でパブリッククラウド上で起動
    - dstack経由でパブリッククラウド上で起動
  - データセット
  - 構成
    - すべての設定オプション
  - 電車
    - データセットの前処理
    - マルチGPU
      - ディープスピード
      - FSDP
      - FSDP + QLoRA
      - 重みとバイアスのロギング
      - 特別なトークン
    - ライガーカーネル
  - 推論遊び場
  - LORA をベースにマージする
- よくあるエラー ?
  - 推論とトレーニングにおけるトークン化の不一致
- ウーパールーパーのデバッグ
- 助けが必要ですか? ?
- バッジ❤?️
- コミュニティショーケース
- 貢献していますか？
- スポンサー?❤
  - ?ダイヤモンドスポンサー - 直接連絡する
  - ?ゴールドスポンサー - $5000/月
  - ?シルバースポンサー - $1000/月
  - ?ブロンズスポンサー - $500/月

Axolotl は微調整のための統合リポジトリを提供します
さまざまなAIモデルを簡単に

さあ、ウーバーイーツの質問をしてください!!

ウーパールートルのサポート

	FP16/FP32	ローラ	クローラ	gptq	gptq (フラッシュ付き)	フラッシュ	xformers に注目
ラマ	✅	✅	✅	✅	✅	✅	✅
ミストラル	✅	✅	✅	✅	✅	✅	✅
ミクストラルMoE	✅	✅	✅	❓	❓	❓	❓
ミクストラル8X22	✅	✅	✅	❓	❓	❓	❓
ピティア	✅	✅	✅				❓
大脳	✅	✅	✅				❓
BTLM	✅	✅	✅				❓
mpt	✅		❓				❓
ハヤブサ	✅	✅	✅				❓
gpt-j	✅	✅	✅			❓	❓
XGen	✅	❓	✅	❓	❓	❓	✅
ファイ	✅	✅	✅	❓	❓	❓	❓
RWKV	✅	❓	❓	❓	❓	❓	❓
クウェン	✅	✅	✅	❓	❓	❓	❓
ジェマ	✅	✅	✅	❓	❓	✅	❓
ジャンバ	✅	✅	✅	❓	❓	✅	❓

✅: サポートされています : サポートされていません ❓: 未テスト

クイックスタート ⚡

ほんの数ステップでウーパールーパーを始めましょう!このクイックスタートガイドでは、基本的な微調整タスクのセットアップと実行について説明します。

要件: Nvidia GPU (Ampere アーキテクチャ以降、 bf16および Flash アテンション用)、Python >=3.10、PyTorch >=2.3.1。

git clone https://github.com/axolotl-ai-cloud/axolotl
cd axolotl

pip3 install packaging ninja
pip3 install -e ' .[flash-attn,deepspeed] '

使用法

 # preprocess datasets - optional but recommended
CUDA_VISIBLE_DEVICES= " " python -m axolotl.cli.preprocess examples/openllama-3b/lora.yml

# finetune lora
accelerate launch -m axolotl.cli.train examples/openllama-3b/lora.yml

# inference
accelerate launch -m axolotl.cli.inference examples/openllama-3b/lora.yml 
    --lora_model_dir= " ./outputs/lora-out "

# gradio
accelerate launch -m axolotl.cli.inference examples/openllama-3b/lora.yml 
    --lora_model_dir= " ./outputs/lora-out " --gradio

# remote yaml files - the yaml config can be hosted on a public URL
# Note: the yaml config must directly link to the **raw** yaml
accelerate launch -m axolotl.cli.train https://raw.githubusercontent.com/axolotl-ai-cloud/axolotl/main/examples/openllama-3b/lora.yml

高度なセットアップ

環境

ドッカー

docker run --gpus ' "all" ' --rm -it axolotlai/axolotl:main-latest

または、開発用に現在のファイルに対して実行します。

docker compose up -d

ヒント

axolotl をデバッグしたい場合、または開発環境として Docker を使用したい場合は、デバッグガイドの Docker に関するセクションを参照してください。

高度なドッカー

実行するより強力な Docker コマンドは次のとおりです。

docker run --privileged --gpus ' "all" ' --shm-size 10g --rm -it --name axolotl --ipc=host --ulimit memlock=-1 --ulimit stack=67108864 --mount type=bind,src= " ${PWD} " ,target=/workspace/axolotl -v ${HOME} /.cache/huggingface:/root/.cache/huggingface axolotlai/axolotl:main-latest

さらに次のことを行います。

--ipcおよび--ulimit引数を使用して、deepspeed などの実行時のメモリの問題 (SIGBUS/signal 7 エラーが発生する可能性など) を防止します。
ダウンロードした HF データ (モデルなど) と、 --mount / -v args を介した axolotl コードへの変更を保持します。
--name引数を使用すると、vscode ( Dev Containers: Attach to Running Container... ) またはターミナルでコンテナを参照しやすくなります。
--privilegedフラグは、コンテナにすべての機能を与えます。
--shm-size 10g引数により、共有メモリのサイズが増加します。 deepspeed を使用しているときにexitcode: -7エラーが表示された場合は、これを使用してください。

詳細については、nvidia の Web サイトをご覧ください

コンダ/ピップベンブ

Python 3.10以上をインストールしてください
pytorch 安定版をインストールします https://pytorch.org/get-started/locally/
Python の依存関係とともに Axolotl をインストールする
```
pip3 install packaging
pip3 install -e ' .[flash-attn,deepspeed] '
```
(オプション) ゲートされたモデル/データセットを使用するには、Huggingface にログインします。
```
huggingface-cli login
```
ハグフェイス.co/settings/tokens でトークンを取得します。

クラウドGPU

Docker イメージをサポートするクラウド GPU プロバイダーの場合は、 axolotlai/axolotl-cloud:main-latestを使用します。

Latitude.sh では、この直接リンクを使用してください
JarvisLabs.ai では、この直接リンクを使用してください
RunPod ではこの直接リンクを使用してください

ベアメタルクラウドGPU

ラムダラボ

クリックして展開します

Pythonをインストールする

sudo apt update
sudo apt install -y python3.10

sudo update-alternatives --install /usr/bin/python python /usr/bin/python3.10 1
sudo update-alternatives --config python # pick 3.10 if given option
python -V # should be 3.10

pipをインストールする

wget https://bootstrap.pypa.io/get-pip.py
python get-pip.py

Pytorch をインストールする https://pytorch.org/get-started/locally/
クイックスタートの指示に従います。
走る

pip3 install protobuf==3.20.3
pip3 install -U --ignore-installed requests Pillow psutil scipy

パスを設定する

 export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu: $LD_LIBRARY_PATH

GCP

クリックして展開します

cuda と pytorch がインストールされた Deeplearning linux OS を使用します。次に、クイックスタートの指示に従います。

xla をアンインストールするには、必ず以下を実行してください。

pip uninstall -y torch_xla[tpu]

窓

WSL または Docker を使用してください。

マック

QuickStart のインストール方法の代わりに、以下を使用してください。

 pip3 install -e '.'

詳細情報: mac.md

Googleコラボ

このサンプルノートを使用してください。

SkyPilot 経由でパブリッククラウド上で起動

7 つ以上のクラウド (GCP、AWS、Azure、OCI など) 上の GPU インスタンス (オンデマンドインスタンスとスポットインスタンスの両方) で起動するには、SkyPilot を使用できます。

pip install " skypilot-nightly[gcp,aws,azure,oci,lambda,kubernetes,ibm,scp] "  # choose your clouds
sky check

Axolotl を使用してmistralai/Mistral-7B-v0.1を微調整するサンプル YAML を取得します。

 git clone https://github.com/skypilot-org/skypilot.git
cd skypilot/llm/axolotl

1 つのコマンドを使用して起動します。

 # On-demand
HF_TOKEN=xx sky launch axolotl.yaml --env HF_TOKEN

# Managed spot (auto-recovery on preemption)
HF_TOKEN=xx BUCKET= < unique-name > sky spot launch axolotl-spot.yaml --env HF_TOKEN --env BUCKET

dstack経由でパブリッククラウド上で起動

パブリッククラウド (GCP、AWS、Azure、Lambda Labs、TensorDock、Vast.ai、CUDO) 上の GPU インスタンス (オンデマンドインスタンスとスポットインスタンスの両方) で起動するには、dstack を使用できます。

以下のように YAML でジョブの説明を記述します。

 # dstack.yaml
type : task

image : axolotlai/axolotl-cloud:main-latest

env :
  - HUGGING_FACE_HUB_TOKEN
  - WANDB_API_KEY

commands :
  - accelerate launch -m axolotl.cli.train config.yaml

ports :
  - 6006

resources :
  gpu :
    memory : 24GB..
    count : 2

次に、 dstack runコマンドを使用してジョブを実行するだけです。スポットインスタンスが必要な場合は、 --spotオプションを追加します。 dstack runコマンドは、複数のクラウドサービス全体で最も安い価格のインスタンスを表示します。

pip install dstack
HUGGING_FACE_HUB_TOKEN=xxx WANDB_API_KEY=xxx dstack run . -f dstack.yaml # --spot

さらに詳細なユースケースについては、公式 dstack ドキュメントと、公式リポジトリにある axolotl サンプルの詳細な説明を参照してください。

データセット

Axolotl はさまざまなデータセット形式をサポートしています。 JSONL を使用することをお勧めします。 JSONL のスキーマは、使用するタスクとプロンプトテンプレートによって異なります。 JSONL の代わりに、各 JSONL フィールドの列を含む HuggingFace データセットを使用することもできます。

さまざまなデータセット形式の使用方法の詳細については、ドキュメントを参照してください。

構成

クイックスタートについては例を参照してください。必要に応じて複製して変更することをお勧めします。最も重要なオプションは次のとおりです。

モデル
```
 base_model : ./llama-7b-hf # local or huggingface repo
```
注: コードは適切なアーキテクチャをロードします。

データセット

 datasets :
    # huggingface repo
  - path : vicgalle/alpaca-gpt4
    type : alpaca

    # huggingface repo with specific configuration/subset
  - path : EleutherAI/pile
    name : enron_emails
    type : completion # format from earlier
    field : text # Optional[str] default: text, field to use for completion data

    # huggingface repo with multiple named configurations/subsets
  - path : bigcode/commitpackft
    name :
      - ruby
      - python
      - typescript
    type : ... # unimplemented custom format

    # chat_template https://axolotl-ai-cloud.github.io/axolotl/docs/dataset-formats/conversation.html#chat_template
  - path : ...
    type : chat_template
    chat_template : chatml # defaults to tokenizer's chat_template

    # local
  - path : data.jsonl # or json
    ds_type : json # see other options below
    type : alpaca

    # dataset with splits, but no train split
  - path : knowrohit07/know_sql
    type : context_qa.load_v2
    train_on_split : validation

    # loading from s3 or gcs
    # s3 creds will be loaded from the system default and gcs only supports public access
  - path : s3://path_to_ds # Accepts folder with arrow/parquet or file path like above. Supports s3, gcs.
    ...

    # Loading Data From a Public URL
    # - The file format is `json` (which includes `jsonl`) by default. For different formats, adjust the `ds_type` option accordingly.
  - path : https://some.url.com/yourdata.jsonl # The URL should be a direct link to the file you wish to load. URLs must use HTTPS protocol, not HTTP.
    ds_type : json # this is the default, see other options below.

読み込み中

 load_in_4bit : true
load_in_8bit : true

bf16 : auto # require >=ampere, auto will detect if your GPU supports this and choose automatically.
fp16 : # leave empty to use fp16 when bf16 is 'auto'. set to false if you want to fallback to fp32
tf32 : true # require >=ampere

bfloat16 : true # require >=ampere, use instead of bf16 when you don't want AMP (automatic mixed precision)
float16 : true # use instead of fp16 when you don't want AMP

注: Repo は 4 ビット量子化を行いません。

ローラ

 adapter : lora # 'qlora' or leave blank for full finetune
lora_r : 8
lora_alpha : 16
lora_dropout : 0.05
lora_target_modules :
  - q_proj
  - v_proj

すべての設定オプション

すべての構成オプションについては、これらのドキュメントを参照してください。

電車

走る

accelerate launch -m axolotl.cli.train your_config.yml

ヒント

パブリック URL でホストされている構成ファイルを参照することもできます。たとえば、 accelerate launch -m axolotl.cli.train https://yourdomain.com/your_config.ymlのように指定します。

データセットの前処理

オプションで、微調整する前に、以下を使用してデータセットを事前にトークン化できます。これは大規模なデータセットに推奨されます。

dataset_prepared_path:事前にトークン化されたデータセットを保存およびロードするためのローカルフォルダーに設定します。
(オプション): push_dataset_to_hub: hf_user/repoを設定して、Huggingface にプッシュします。
(オプション): --debugを使用して、前処理された例を表示します。

python -m axolotl.cli.preprocess your_config.yml

マルチGPU

以下は、複数の GPU を使用したトレーニングに axolotl で利用できるオプションです。 FSDP では損失が不安定になる可能性があるため、現時点では DeepSpeed が推奨されるマルチ GPU オプションであることに注意してください。

ディープスピード

Deepspeed は、マルチ GPU システム用の最適化スイートであり、通常 GPU の VRAM に収まるよりもはるかに大きなモデルをトレーニングできるようになります。 deepspeed のさまざまな最適化タイプの詳細については、https://huggingface.co/docs/accelerate/main/en/usage_guides/deepspeed#what-is-integrated を参照してください。

ZeRO ステージ 1、2、および 3 用に、いくつかのデフォルトのディープスピード JSON 構成が提供されています。

 deepspeed : deepspeed_configs/zero1.json

accelerate launch -m axolotl.cli.train examples/llama-2/config.yml --deepspeed deepspeed_configs/zero1.json

FSDP

ラマFSDP

 fsdp :
  - full_shard
  - auto_wrap
fsdp_config :
  fsdp_offload_params : true
  fsdp_state_dict_type : FULL_STATE_DICT
  fsdp_transformer_layer_cls_to_wrap : LlamaDecoderLayer

FSDP + QLoRA

Axolotl は FSDP と QLoRA を使用したトレーニングをサポートしています。詳細については、これらのドキュメントを参照してください。

重みとバイアスのロギング

WANDB_API_KEY環境変数が設定されていること (推奨) を確認するか、 wandb loginを使用して wandb にログインしてください。

ワンドブのオプション

 wandb_mode :
wandb_project :
wandb_entity :
wandb_watch :
wandb_name :
wandb_log_model :

彗星の記録

COMET_API_KEY環境変数が設定されていることを確認するか (推奨)、またはcomet loginを使用して wandb にログインします。

ワンドブのオプション

 use_comet :
comet_api_key :
comet_workspace :
comet_project_name :
comet_experiment_key :
comet_mode :
comet_online :
comet_experiment_config :

特別なトークン

トークナイザーのボキャブラリに区切り文字、シーケンスの終わり、シーケンスの始まりなどの特別なトークンを含めることが重要です。これは、トークン化の問題を回避し、モデルのトレーニングを改善するのに役立ちます。 axolotl では次のようにこれを行うことができます。

 special_tokens :
  bos_token : " <s> "
  eos_token : " </s> "
  unk_token : " <unk> "
tokens : # these are delimiters
  - " <|im_start|> "
  - " <|im_end|> "

これらのトークンを axolotl 構成に含めると、axolotl はこれらのトークンをトークナイザーのボキャブラリーに追加します。

ライガーカーネル

Liger カーネル: LLM トレーニング用の効率的な Triton カーネル

https://github.com/linkedin/Liger-Kernel

Liger (LinkedIn GPU Efficient Runtime) カーネルは、LLM トレーニング用に特別に設計された Triton カーネルのコレクションです。マルチ GPU トレーニングのスループットを効果的に 20% 向上させ、メモリ使用量を 60% 削減できます。 Liger カーネルは適切に構成されており、FSDP と Deepspeed の両方と互換性があります。

 plugins :
  - axolotl.integrations.liger.LigerPlugin
liger_rope : true
liger_rms_norm : true
liger_glu_activation : true
liger_layer_norm : true
liger_fused_linear_cross_entropy : true

推論遊び場

Axolotl を使用すると、モデルをインタラクティブなターミナルプレイグラウンドにロードして、迅速な実験を行うことができます。構成ファイルは、トレーニングに使用される構成ファイルと同じです。

トレーニングされたモデルの種類に応じて、適切なフラグを推論コマンドに渡します。

事前トレーニングされた LORA:

python -m axolotl.cli.inference examples/your_config.yml --lora_model_dir= " ./lora-output-dir "

フルウェイトの微調整:

python -m axolotl.cli.inference examples/your_config.yml --base_model= " ./completed-model "

テキストファイルからのプロンプトを使用して完全なウェイトを微調整します。

cat /tmp/prompt.txt | python -m axolotl.cli.inference examples/your_config.yml 
  --base_model= " ./completed-model " --prompter=None --load_in_8bit=True

-- gradio ホスティングを使用する場合

python -m axolotl.cli.inference examples/your_config.yml --gradio

--sample_packing Falseオンにしていて、以下のようなエラーが表示される場合は、それを使用してください。

RuntimeError: スタックは各テンソルが等しいサイズであることを期待していますが、エントリ 0 で [1, 32, 1, 128] を取得し、エントリ 1 で [1, 32, 8, 128] を取得しました。

LORA をベースにマージする

次のコマンドは、LORA アダプターをベースモデルとマージします。オプションで引数--lora_model_dirを渡して、LORA アダプターが保存されたディレクトリを指定できます。それ以外の場合、これは axolotl 構成ファイルのoutput_dirから推測されます。マージされたモデルはサブディレクトリ{lora_model_dir}/mergedに保存されます。

python3 -m axolotl.cli.merge_lora your_config.yml --lora_model_dir= " ./completed-model "

メモリ不足を避けるために、 gpu_memory_limitおよびlora_on_cpu構成オプションの使用が必要になる場合があります。それでも CUDA メモリが不足する場合は、次のようにシステム RAM をマージしてみることができます。

CUDA_VISIBLE_DEVICES= " " python3 -m axolotl.cli.merge_lora ...

ただし、これは非常に時間がかかるため、代わりに上記の構成オプションを使用することをお勧めします。

よくあるエラー ?

FAQ とデバッグガイドも参照してください。

「Cuda メモリ不足」エラーが発生した場合は、トレーニングプロセス中に GPU のメモリが不足したことを意味します。解決方法は次のとおりです。

以下のいずれかを減らしてください

micro_batch_size
eval_batch_size
gradient_accumulation_steps
sequence_len

それでも問題が解決しない場合は、コマンドで deepspeed と加速を使用せずに実行してみてください (「accelerate launch」を「python」に置き換えます)。

adamw_bnb_8bit を使用すると、メモリを節約できる場合もあります。

failed (exitcode: -9)

通常は、システムのシステムメモリが不足していることを意味します。同様に、VRAM が不足した場合と同じ設定を下げることを検討する必要があります。さらに、システム RAM のアップグレードも検討してください。これは GPU のアップグレードよりも簡単です。

RuntimeError: スカラー型 Float が予期されましたが、Half が見つかりました

fp16: true設定してみてください

NotImplementedError: memory_efficient_attention_forwardの演算子が見つかりません ...

xformers をオフにしてみてください。

加速設定がありません

無視しても安全です。

トレーニング中の NCCL タイムアウト

NCCL ガイドを参照してください。

推論とトレーニングにおけるトークン化の不一致

多くの形式では、Axolotl は文字列をトークン化した後にトークン ID を連結することによってプロンプトを構築します。文字列を操作するのではなくトークン ID を連結する理由は、アテンションマスクの正確なアカウンティングを維持するためです。

axolotl によって構築されたプロンプトをデコードすると、特に区切り文字や特別なトークンの周囲に、予期しないトークン間のスペース (またはその欠落) が表示される場合があります。新しいフォーマットを使い始めるときは、常に次のことを行う必要があります。

python -m axolotl.cli.preprocess your_config.yml --debug使用して一部のデータを実体化し、モデルのトークナイザーで最初の数行をデコードします。
推論中、トークン ID のテンソルをモデルに渡す直前に、これらのトークンをデコードして文字列に戻します。
#2 の推論文字列が、スペースや改行も含めて #1 で微調整したデータとまったく同じであることを確認してください。それらが同じでない場合は、それに応じて推論サーバーを調整します。
追加のトラブルシューティング手順として、1 と 2 の間のトークン ID を調べて、それらが同一であることを確認できます。

トレーニング中と推論中にプロンプトの位置がずれていると、モデルのパフォーマンスが非常に低下する可能性があるため、これを確認する価値があります。具体的な例については、このブログ投稿を参照してください。

ウーパールーパーのデバッグ

Axolotl のデバッグに関するヒントと、VSCode を使用したデバッグの構成例については、このデバッグガイドを参照してください。

助けが必要ですか? ?

私たちのコミュニティメンバーがあなたを助けることができる Discord サーバーに参加してください。

専用のサポートが必要ですか?専用のサポートオプションについては、✉️[email protected] までお問い合わせください。

バッジ❤?️

アホロートルで何かクールなものを作りませんか？モデルカードにバッジを追加することを検討してください。

 [ < img src = " https://raw.githubusercontent.com/axolotl-ai-cloud/axolotl/main/image/axolotl-badge-web.png " alt = " Built with Axolotl " width = " 200 " height = " 32 " /> ] ( https://github.com/axolotl-ai-cloud/axolotl )

コミュニティショーケース

Axolotl を使用して構築されたプロジェクトとモデルのいくつかをチェックしてください。コミュニティショーケースに追加したいモデルがありますか?モデルを使用して PR を開きます。

オープンアクセスAI集合体

ミノタウロス 13b
マンティコア 13b
ヒッポグリフ 30b

ポケットドックラボ

ダンのパーソナリティエンジン 13b LoRA

貢献していますか？

貢献ガイドをお読みください

バグ？オープンな問題を確認してください。それ以外の場合は、新しい問題を作成してください。

PRの方も大歓迎です！

クイックスタート手順を実行してから、以下の手順を実行して環境をセットアップしてください。

pip3 install -r requirements-dev.txt -r requirements-tests.txt
pre-commit install

# test
pytest tests/

# optional: run against all files
pre-commit run --all-files

これまでの寄稿者全員に感謝します。 Axolotl に貢献することで、オープンソース AI の進歩を推進してください。

スポンサー?❤

OpenAccess AI Collective は、winglian、NanoCode012、tmm1、mhenrichsen、casper-hansen、hamelsmu などのボランティアの貢献者によって運営されており、バグを修正し、コミュニティの質問に答え、新機能を実装することで、私たちの前進を加速するのに役立ちます。 Axolotl は、単体テストと統合テストの実行、コミュニティの問題のトラブルシューティング、報奨金の提供に必要なコンピューティングのために、スポンサーからの寄付を必要としています。アホロートルが好きなら、GitHub スポンサーや Ko-fi を通じてプロジェクトのスポンサーになることを検討するか、[email protected] に直接連絡してください。

?ダイヤモンドスポンサー - 直接連絡する

?ゴールドスポンサー - $5000/月

?シルバースポンサー - $1000/月

?ブロンズスポンサー - $500/月

ジャービスラボ.ai

拡大する

追加情報

バージョン v0.5.2
タイプその他のソースコード
更新時間 2024-12-02
サイズ 2.04MB
から Github

axolotl

目次

ウーパールートルのサポート

クイックスタート ⚡

使用法

高度なセットアップ

環境

ドッカー

コンダ/ピップベンブ

クラウドGPU

ベアメタルクラウドGPU

ラムダラボ

GCP

窓

マック

Googleコラボ

SkyPilot 経由でパブリック クラウド上で起動

dstack経由でパブリッククラウド上で起動

データセット

構成

すべての設定オプション

電車

データセットの前処理

マルチGPU

ディープスピード

FSDP

FSDP + QLoRA

重みとバイアスのロギング

彗星の記録

特別なトークン

ライガーカーネル

推論遊び場

LORA をベースにマージする

よくあるエラー ?

推論とトレーニングにおけるトークン化の不一致

ウーパールーパーのデバッグ

助けが必要ですか? ?

バッジ❤?️

コミュニティショーケース

貢献していますか？

スポンサー?❤

?ダイヤモンド スポンサー - 直接連絡する

?ゴールド スポンサー - $5000/月

?シルバー スポンサー - $1000/月

?ブロンズ スポンサー - $500/月

SkyPilot 経由でパブリッククラウド上で起動

?ダイヤモンドスポンサー - 直接連絡する

?ゴールドスポンサー - $5000/月

?シルバースポンサー - $1000/月

?ブロンズスポンサー - $500/月