聊天机器人开发人员的深度学习
- 聊天机器人开发者深度学习课程资料(2017 年 9 月)
- 作者:赵杰民
- 欢迎拉请求:)
内容
第一天 聊天机器人简介(幻灯片)
- NLP/聊天机器人简介
- 韩语/英语 NLP 工具包/数据集概述
- 教程(代码)
- spaCy/gensim/konlpy/其他韩国工具包简介
- 通过 TF-IDF (scikit-learn) 进行情感分类
- 聊天机器人流水线 / 通过 Kakaotalk (flask) / Slack (slacker) 提供服务
第 2 天使用 CNN/RNN 进行文本分类(幻灯片)
- 用于文本分类的 CNN
- Word CNN / Dynamic CNN / Char CNN / Very Deep CNN
- 用于文本分类的 RNN
- 双向 RNN / 递归 NN / 树 LSTM / 双编码器 LSTM
- 先进的 CNN/RNN 架构
- QRNN / SRU / ByteNet / SliceNet / LSTM-CNNs-CRF
- 教程(代码)
- 用于情感分析的 Word-CNN
- PyTorch 风格指南
- TorchText 教程
第 3 天 使用 Seq2Seq/Attention 进行对话建模(slideshare)
- 用于对话建模的 Seq2Seq 模型
- Seq2Seq / 神经对话模型 / 多样性提示目标:MMI
- 先进的 Seq2Seq 架构
- 展示和讲述 / HRED / VHRED / 基于个人的神经对话模型 / 语境化词向量 (CoVe)
- 注意力机制
- 高级注意力架构
- 展示、出席和讲述 / Pointer Networks / CopyNet / BiDAF / Transformer
- 教程(代码)
- 带有 Attention 的 Seq2Seq 机器翻译
第 04 天 使用外部存储器进行 QA(幻灯片共享)
- 使用外部存储器进行质量检查
- 内存网络/端到端内存网络/键值内存网络/神经图灵机
- 先进的内存架构
- 高级对话架构
- MILABOT / 基于对话的语言学习 / 端到端目标导向对话 / 深度强化学习 / 对抗性
- 教程(代码)
依赖关系
蟒蛇3
- 代码是用 Anacodna Python 3.6 编写的。
- 建议通过 Conda 或 virtualenv 进行包管理。
机器学习/自然语言处理
- 火炬
- 火炬文本
- 斯帕西
- sckit-学习
- 根西姆
- konlpy(需要 Jpype3)
交互/数据框/绘图
Kakaotalk / Slack 机器人