聊天機器人開發人員的深度學習
- 聊天機器人開發者深度學習課程資料(2017 年 9 月)
- 作者:趙傑民
- 歡迎拉請求:)
內容
第一天 聊天機器人簡介(幻燈片)
- NLP/聊天機器人簡介
- 韓語/英語 NLP 工具包/資料集概述
- 教程(程式碼)
- spaCy/gensim/konlpy/其他韓國工具包介紹
- 透過 TF-IDF (scikit-learn) 進行情緒分類
- 聊天機器人管線 / 透過 Kakaotalk (flask) / Slack (slacker) 提供服務
第 2 天使用 CNN/RNN 進行文字分類(幻燈片)
- 用於文本分類的 CNN
- Word CNN / Dynamic CNN / Char CNN / Very Deep CNN
- 用於文字分類的 RNN
- 雙向 RNN / 遞歸 NN / 樹 LSTM / 雙編碼器 LSTM
- 先進的 CNN/RNN 架構
- QRNN / SRU / ByteNet / SliceNet / LSTM-CNNs-CRF
- 教程(程式碼)
- 用於情緒分析的 Word-CNN
- PyTorch 風格指南
- TorchText 教學課程
第 3 天 使用 Seq2Seq/Attention 進行對話建模(slideshare)
- 用於對話建模的 Seq2Seq 模型
- Seq2Seq / 神經對話模型 / 多樣性提示目標:MMI
- 先進的 Seq2Seq 架構
- 展示與講述 / HRED / VHRED / 基於個人的神經對話模型 / 語境化詞向量 (CoVe)
- 注意力機制
- 高階注意力架構
- 展示、出席與講述 / Pointer Networks / CopyNet / BiDAF / Transformer
- 教程(程式碼)
- 帶有 Attention 的 Seq2Seq 機器翻譯
第 04 天 使用外部記憶體進行 QA(幻燈片共用)
- 使用外部記憶體進行品質檢查
- 記憶體網路/端對端記憶體網路/鍵值記憶體網路/神經圖靈機
- 先進的記憶體架構
- 進階對話架構
- MILABOT / 以對話為基礎的語言學習 / 端對端目標導向對話 / 深度強化學習 / 對抗性
- 教程(程式碼)
依賴關係
蟒蛇3
- 程式碼是用 Anacodna Python 3.6 寫的。
- 建議透過 Conda 或 virtualenv 進行套件管理。
機器學習/自然語言處理
- 火炬
- 火炬文本
- 史帕西
- sckit-學習
- 根西姆
- konlpy(需要 Jpype3)
互動/資料框/繪圖
Kakaotalk / Slack 機器人