mergooダウンロード - mergooソースコードのダウンロード

mergoo

AI ソースコード

1.0.0

ダウンロード

メルグー

mergooは、複数の LLM エキスパートを簡単にマージし、マージされた LLM を効率的にトレーニングするためのライブラリです。 mergoo使用すると、さまざまな汎用またはドメインベースの LLM 専門家の知識を効率的に統合できます。

特徴

複数のマージ方法をサポート: Mixture-of-Experts 、 Mixture-of-Adapters 、 Layer-wise merge
レイヤーごとに柔軟に結合
サポートされている基本モデル: Llama (LLaMa3 を含む)、Mistral、Phi3、および BERT
サポートされているトレーナー: ?トレーナー、SFトレーナー、PEFT
サポートされているデバイス: CPU、MPS、GPU
トレーニングの選択肢: MoE レイヤーのルーターのみ、またはマージ LLM の完全な微調整

プロジェクトが気に入ったら、 ️ を残すことを検討してください。

インストール

pip でインストールします。

 pip install mergoo

最新の不安定バージョンを Github にインストールします。

 pip install git+https://github.com/Leeroo-AI/mergoo

ソースからインストールします。

 git clone https://github.com/Leeroo-AI/mergoo
cd mergoo
pip install -e .

クイックスタート

構成のセットアップ

マージ用の構成を指定します。

model_type : 基本モデルのタイプ。選択肢: mistral 、 llama 、またはbert 。
num_experts_per_token : MoE の各トークンの専門家の数。
experts : エキスパートがマージするための設定。 expert_nameと Hugging Face が含まれますか? model_id 。
router_layers : 専門家の混合を適用するために選択されたレイヤー。

完全に調整された専門家

これは、完全に微調整された LLM エキスパートをマージする場合のサンプル構成です。

 config = {
    "model_type" : "mistral" ,
    "num_experts_per_tok" : 2 ,
    "experts" : [
        { "expert_name" : "base_expert" , "model_id" : "mistralai/Mistral-7B-v0.1" },
        { "expert_name" : "expert_1" , "model_id" : "meta-math/MetaMath-Mistral-7B" },
        { "expert_name" : "expert_2" , "model_id" : "ajibawa-2023/Code-Mistral-7B" }
    ],
    "router_layers" : [ "gate_proj" , "up_proj" , "down_proj" ]
}

上の例では、数学とコードのミストラルベースの専門家を統合しました。詳細については、このノートを参照してください。

アダプターの混合 (LoRA に関する MoE)

これは、 LoRA の微調整された LLM エキスパートをマージする場合のサンプル構成です。 mergoo LoRA の上にルーティング層を構築するため、アダプターが混在します。

 config = {
    "model_type" : "mistral" ,
    "num_experts_per_tok" : 2 ,
    "base_model" : "mistralai/Mistral-7B-v0.1" ,
    "experts" : [
        { "expert_name" : "adapter_1" , "model_id" : "predibase/customer_support" },
        { "expert_name" : "adapter_2" , "model_id" : "predibase/customer_support_accounts" },
        { "expert_name" : "adapter_3" , "model_id" : "predibase/customer_support_orders" },
        { "expert_name" : "adapter_4" , "model_id" : "predibase/customer_support_payments" }
    ],
}

expert_name expertではなくadapterで始まります。詳細については、このノートを参照してください。

専門家をマージする

構成セットアップに続いて、 mergooマージされた LLM を次のように作成します。

 import torch
from mergoo . compose_experts import ComposeExperts

# create checkpoint
model_id = "data/mistral_lora_moe"
expertmerger = ComposeExperts ( config , torch_dtype = torch . float16 )
expertmerger . compose ()
expertmerger . save_checkpoint ( model_id )

ロード / Finetune マージエキスパート

これで、Hugging Face Trainer を使用してマージされた LLM を簡単にトレーニングできるようになりました。

 from transformers import Trainer
from mergoo . models . modeling_mistral import MistralForCausalLM

model = MistralForCausalLM . from_pretrained ( "data/mistral_lora_moe" ) 
# NOTE: 'gate' / router layers are untrained hence weight loading warning would appeare for them

trainer = Trainer ( ... )
trainer . train ()

もっと詳しく知る：

クイックスタートガイドを完了したら、以下のチュートリアルを参照して、 mergooにさらに慣れることができます。

ノート	詳細
完全に微調整された LLM 専門家による MoE	完全に微調整された専門家による統一された専門家混合モデルを構築します。 BTX Research (メタ AI) からインスピレーションを受けました。
MoE と LoRA の微調整された専門家	適応者の混合エキスパートを構築します。インスピレーションを得た xlora \| LoRA の混合 \|モル \|ファツグース \|モエロラ
ハグフェイスブログ	mergoo ライブラリのマージ方法の背後にある研究の詳細を深く掘り下げる
LLaMa3 ベースのエキスパート	LLaMa3 ベースのドメインエキスパートを統合して、独自の MoE スタイル LLM エキスパートを構築します
Phi3 ベースの専門家	Phi3 ベースの微調整されたモデルを結合して MoE スタイルの LLM アーキテクチャを作成する

Mergoo のロードマップと貢献

急速に進化する分野のオープンソースライブラリとして、新機能の導入、インフラストラクチャの強化、ドキュメントの改善などの貢献を歓迎します。

mergooロードマップは次のとおりです。

お気軽に新機能を提案したり、 mergooロードマップに貢献してください。

私たちのコミュニティに参加してください！

皆様からのフィードバックをお待ちしております。Leeroo コミュニティにご参加ください:

ツイッター
リンクトイン
Webサイト
不和

ここに記載されていない質問がありますか? GitHub Issue を開くか、メールを送信してください。

拡大する

追加情報

バージョン 1.0.0
タイプ AI ソースコード
更新時間 2024-12-04
サイズ 1.66MB
から Github

mergoo

メルグー

特徴

インストール

クイックスタート

構成のセットアップ

完全に調整された専門家

アダプターの混合 (LoRA に関する MoE)

専門家をマージする

ロード / Finetune マージエキスパート

もっと詳しく知る：

Mergoo のロードマップと貢献

私たちのコミュニティに参加してください！

node telegram bot api

typebot.io

python wechaty getting started

TranscriberBot

genal chat

Facemoji

chat.petals.dev

GPT Prompt Templates

GPTyped

node telegram bot api

typebot.io

python wechaty getting started

waymo open dataset

termwind

wp functions

mergoo

メルグー

特徴

インストール

クイックスタート

構成のセットアップ

完全に調整された専門家

アダプターの混合 (LoRA に関する MoE)

専門家をマージする

ロード / Finetune マージ エキスパート

もっと詳しく知る：

Mergoo のロードマップと貢献

私たちのコミュニティに参加してください！

ロード / Finetune マージエキスパート