deeplearning nlp modelsダウンロード - deeplearning nlp modelsソースコードのダウンロード

deeplearning nlp models

AI ソースコード

1.0.0

ダウンロード

ディープラーニング-nlp-モデル

PyTorch でのいくつかの「深い」NLP モデルの再実装を含む、小さくて解釈可能なコードベース。

これは、NLP の DL アーキテクチャの雑草に興味がある人のための (不完全な) 出発点として提示されています。注釈付きモデルは、いくつかの注釈とともに表示されます。

ノートブック経由でGPUを使用して colab でこれらのモデルを実行するためのリンクがあります。

現行モデル: word2vec、CNN、トランスフォーマー、gpt。 (作業中)

バート: 読書です。理解しています。

注: これらは各モデルの玩具版です。

コンテンツ

モデル
特徴
エンドゲーム
ロードマップ
設定
構造
要件
引用
ライセンス

モデル

これらの NLP モデルは時系列に示されており、ご想像のとおり、相互に構築されています。

モデルクラス	モデル	年
埋め込み
1.	Word2Vec 埋め込み (自己教師あり学習)	2013年
CNN
2.	CNN ベースのテキスト分類 (バイナリ分類)	2014年
トランスフォーマー
3.	OG Transformer (機械翻訳)	2017年
4.	OpenAIのGPTモデル（言語モデル）	2018年、2019年、2020年

特徴

このリポジトリには次の機能があります。

モデルの概要: 各モデルの動機と設計の簡単な概要は、別の README.md ファイルに記載されています。
Jupyter ノートブック (GPU を備えた colab で簡単に実行できます) : モデルの実行方法とモデル結果の簡単な分析を示す Jupyter ノートブック。
自己完結型: トークナイザー、データセットローダー、辞書、および各問題に必要なすべてのカスタムユーティリティ。

エンドゲーム

これらのモデルを確認した後は、他のモデルについても検討する必要があります。

Char-RNN、BERT、ELMO、XLNET、その他すべての BERT、BART、Performer、T5 など....

ロードマップ

将来実装するモデル:

Char-RNN (カパルシー)
バート

将来のリポジトリ機能:

テンソルボードプロット
ヴァルセットのデモンストレーション
チェックポイントの保存/モデルのロード
BPE (openai/gpt-2 または Facebook の Fairseq ライブラリから)

設定

pip使用してリポジトリをインストールできます。

 pip install git + https : // github . com / will - thompson - k / deeplearning - nlp - models

構造

リポジトリの内訳は次のとおりです。

nlpmodels/models : 各論文のモデルコード。
nlpmodels/utils : データセット、語彙、トークナイザー、サンプラー、トレーナークラスなど、モデルの構築に関連するすべての補助クラスが含まれています。 (注:モデル以外のファイルのほとんどは utils にスローされます。大規模なリポジトリではこれを行わないことをお勧めします。)
tests : 軽い (そして決して包括的ではない) 範囲。
notebooks : 各モデル実装のノートブックとメモが含まれます。

いくつかの便利なコマンド:

make test : テストの完全なスイートを実行します ( setup.py testおよびrun_tests.sh使用することもできます)。
make test_light : 回帰テストを除くすべてのテストを実行します。
make lint : コードの lint チェックが本当に好きなら ( run_pylint.shを実行することもできます)。

要件

Python 3.6+

パッケージの要件は次のとおりです (requirements.txt にあります)。

引用

 @ misc { deeplearning - nlp - models ,
  author = { Thompson , Will },
  url = { https : // github . com / will - thompson - k / deeplearning - nlp - models },
  year = { 2020 }
}