lad gptダウンロード - lad gptソースコードのダウンロード

日本語

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

ホーム>プログラミング関連>AI ソースコード

lad gpt

AI ソースコード

October 2023 Release

ダウンロード

WhatsApp チャットで言語モデルをトレーニングする

概要

このリポジトリは、WhatsApp チャットメッセージのみに基づいて文字レベルまたは単語レベルの言語モデルのトレーニングを容易にします。モデルのトレーニング後、Whatsapp でトレーニングされたチャットグループとの合成会話を開始できます。

チャットメッセージ: Mio キャラクターが 8 人を超えるグループの Whatsapp チャットでモデルを非公開でトレーニングしました。 assets/input/chat.txtは単なるプレースホルダーであり、チャットメッセージの実際のコーパスに置き換えられます。
言語モデル:このモデルは、Vaswani et の「Attending Is All You Need」(2017) で導入されたアーキテクチャに厳密に従っています。また、モデルの pytorch 実装は、Andrew Kaparty によるビデオチュートリアルに大きく影響を受けています。
結果:私が個人的にトレーニングしたモデルの全体的なパフォーマンスは明らかに sota 言語モデルと比較できませんが、生成されたテキストは明らかに認識可能な言語パターンと語彙を示しています。

フォルダー構造

 |-- assets
|   |-- input
|   |   |-- chat.txt
|   |-- output
|   |   |-- contacts.txt
|   |   |-- vocab.txt
|   |   |-- train.pt
|   |   |-- valid.pt
|   |-- models
|   |   |--model.pt
|-- src
|   |-- chat.py
|   |-- model.py
|   |-- preprocess.py
|   |-- train.py
|   |-- utils.py
|-- config.py
|-- run.py

資産の説明:

assets/input/chat.txt:入力ファイルは、エクスポートされた WhatsApp チャット (メディアなし) である必要があります。
assets/output/:エンコードされたトレーニング/検証データとトレーニングされたモデルがこの場所に書き込まれます。
assets/models/model.pt:トレーニングされた pytorch モデルオブジェクト。

モジュールの説明:

src/preprocess.py:チャットメッセージをエンコードされた PyTorch テンソルに変換します。データはトレーニングセットと検証セットに分割されます。
src/model.py:言語モデルクラスを定義します。
src/train.py:言語モデルをトレーニングするためのコードが含まれています。
src/chat.py:モデルとの会話対話のための関数が含まれています。
src/utils.py:その他の便利なユーティリティ関数。
run.py: 3 つのアクション (「前処理」、「トレーニング」、「チャット」) のいずれかを呼び出すための引数パーサーを含むメインスクリプト。
config.py:前処理とモデルのトレーニング用のパラメーターが記録されます。

始め方

インストール:

 git clone https://github.com/bernhard-pfann/lad-gpt.git
cd lad-gpt
pip install -r requirements.txt

このプロジェクトを最大限に活用するには、WhatsApp チャットからのメッセージを含む .txt ファイルが必要です。 WhatsApp グループチャットを .txt ファイルにエクスポートする手順は次のとおりです。

Android ユーザーの場合:

WhatsApp を開いてグループチャットに移動する: Android デバイスで WhatsApp アプリケーションを開き、エクスポートするグループチャットに移動します。
3 つの点をタップします。これらは通常、チャットウィンドウの右上隅にあります。
詳細 -> チャットのエクスポート: ドロップダウンから [詳細] を選択し、[チャットのエクスポート] を選択します。
メディアなしを選択: メディアを含めるか除外するオプションが表示されます。テキストメッセージのみをエクスポートするには、「メディアなし」を選択します。
エクスポート方法の選択: チャットをエクスポートする方法を選択するよう求められます。これを電子メールに送信し、そこから .txt ファイルとしてダウンロードできます。

iPhone ユーザーの場合:

WhatsApp を開いてグループチャットに移動する: iPhone で WhatsApp アプリケーションを開き、エクスポートするグループチャットに移動します。
グループ名をタップします。これはチャットウィンドウの上部にあり、[グループ情報] に移動します。
下にスクロールしてチャットをエクスポート: 下にスクロールすると、「チャットをエクスポート」オプションが表示されます。それをタップしてください。
メディアなしを選択: メディアファイルを含めるかどうかを尋ねるポップアップが表示されます。「メディアなし」を選択します。
エクスポート方法の選択: チャットをエクスポートするオプション (メールなど) を選択します。その後、電子メールからテキストファイルをダウンロードできます。

.txt ファイルを取得したら、 chat.txtという名前で、 assets/inputディレクトリに配置します。これで準備完了です！

端末の説明

入力データが配置されたら、チャットを数値テンソルにエンコードする必要があります。エンコードされたデータもトレーニングセットと検証セットに分割されます。

 python run.py preprocess

エンコードされたチャットデータのみに基づいて、言語モデルを最初からトレーニングすること。既存のモデルのトレーニングを続行する場合は、 --updateを設定します。

 python run.py train --update

トレーニングされたモデルとのチャットを開始するには:

 python run.py chat

拡大する

追加情報

バージョン October 2023 Release
タイプ AI ソースコード
更新時間 2024-12-30
サイズ 50MB
から Github

関連アプリ

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GPT 映画とテレビの最新バージョン

2023-10-30

おすすめ

chat.petals.dev

その他のソースコード

1.0.0
GPT Prompt Templates

その他のソースコード

1.0.0
GPTyped

その他のソースコード

GPTyped 1.0.5
node telegram bot api

AI ソースコード

v0.50.0
typebot.io

AI ソースコード

v3.1.2
python wechaty getting started

AI ソースコード

1.0.0
waymo open dataset

その他のソースコード

December 2023 Update
termwind

その他のカテゴリー

v2.3.0
wp functions

その他のカテゴリー

1.0.0

関連情報すべて