deeplearning nlp models下载 - deeplearning nlp models源码下载

中文(简体)

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

首页>编程相关>Ai源码

deeplearning nlp models

Ai源码

1.0.0

下载

深度学习 NLP 模型

一个小型的、可解释的代码库，包含 PyTorch 中一些“深层”NLP 模型的重新实现。

对于那些有兴趣深入了解 NLP 中的 DL 架构的人来说，这是一个（不完整的）起点。带注释的模型与一些注释一起呈现。

有链接可以通过笔记本在带有GPU的 Colab 上运行这些模型？️。

当前型号：word2vec、CNN、变压器、gpt。（工作正在进行中）

伯特：阅读。领悟。

注意：这些是每个模型的玩具版本。

内容

型号
特征
终局之战
路线图
设置
结构
要求
引文
执照

型号

这些 NLP 模型按时间顺序呈现，并且如您所料，相互构建。

模型类	模型	年
嵌入
1.	Word2Vec 嵌入（自我监督学习）	2013年
CNN
2.	基于CNN的文本分类（二元分类）	2014年
变形金刚
3.	OG Transformer（机器翻译）	2017年
4.	OpenAI的GPT模型（语言模型）	2018, 2019, 2020

特征

该存储库具有以下功能：

模型概述：单独的 README.md 文件中提供了每个模型的动机和设计的简要概述。
Jupyter 笔记本（易于在带有 GPU 的 Colab 上运行）：Jupyter 笔记本展示了如何运行模型以及对模型结果的一些简单分析。
独立的：分词器、数据集加载器、字典以及每个问题所需的所有自定义实用程序。

终局之战

在回顾了这些模型之后，您可以探索其他模型：

Char-RNN、BERT、ELMO、XLNET、所有其他 BERT、BART、Performer、T5 等...

路线图

未来要实施的模型：

Char-RNN (Kaparthy)
伯特

未来的回购功能：

张量板图
Val设置演示
保存检查点/加载模型
BPE（来自 openai/gpt-2 或 facebook 的 fairseq 库）

设置

您可以使用pip安装存储库：

 pip install git + https : // github . com / will - thompson - k / deeplearning - nlp - models

结构

以下是存储库的细分：

nlpmodels/models ：每篇论文的模型代码。
nlpmodels/utils ：包含与构建模型相关的所有辅助类，包括数据集、词汇、分词器、采样器和训练器类。（注意：大多数非模型文件都被放入 utils 中。我建议不要在较大的存储库中这样做。）
tests ：轻度（绝不是全面）覆盖。
notebooks ：包含每个模型实现的笔记本和文章。

一些有用的命令：

make test ：运行全套测试（您还可以使用setup.py test和run_tests.sh ）。
make test_light ：运行除回归测试之外的所有测试。
make lint ：如果你真的喜欢 linting 代码（也可以运行run_pylint.sh ）。

要求

Python 3.6+

以下是软件包要求（可在requirements.txt中找到）

引文

 @ misc { deeplearning - nlp - models ,
  author = { Thompson , Will },
  url = { https : // github . com / will - thompson - k / deeplearning - nlp - models },
  year = { 2020 }
}