このトラックの目標は、ナレッジ グラフに基づいてアクティブなチャット タスクを設定することです。知識主導型対話 公式サイトアドレス
会話ターゲット g (g=START->TOPIC_A->TOPIC_B) は、マシンがコールド スタート状態からトピック A に、次にトピック B にアクティブにチャットすることを意味します。これは、このタスクでは、マシンが会話を積極的にガイドし、特定のトピックには映画やエンターテイメントのキャラクターが含まれることを意味します。
関連知識情報 M (M=f1,f2,...,fn) には、トピック A の知識情報、トピック B の知識情報、トピック A とトピック B の関連情報の 3 つのカテゴリが含まれます。このタスクでは、具体的な関連知識情報として、映画の興行収入、監督、評価などがSPOの形式で表現されます。つまり、(主語、述語、目的語)、つまり (実体 1、述語、実体 2) です。
現在の対話シーケンス H=u1,u2,...u(t-1)
マシンは「ut」と応答します。
自動評価指標と手動評価指標の組み合わせ。自動評価指標では、文字レベル (F1 スコア)、単語レベル (BLEU)、および応答多様性 (DISTINCT) の 3 つの測定レベルが考慮されます。応答の多様性に関しては、依然として単語の計算に基づいていますが、生成された単語の別の次元を調べます。参考文献 2 で著者は次のように書いています。
個別-1 と個別-2 はそれぞれ、個別のユニグラムとバイグラムの数を生成された単語の総数で割ったものです。
PyTorch によって公式に提供されているチュートリアル (参考文献 4 を参照) を参照すると、seq2seq の観点から問題を解決する方法は、複数ラウンドの対話を並列文に分割することです。たとえば、現在の対話シーケンス H=u1,u2,...u(t-1) は、u1->u2;u2->u3;...; という t-2 個のサンプル グループに分割できます。 u (t-2)->u(t-1); ただし、この分割方法には、文間の滑らかさという明らかな問題があります。これは質問のはずですが、深く考えていませんでした。
現在、PyTorch公式チャットボットのチュートリアルコードがリファクタリングされ、各モジュールが分離され、バグが発見されています。これに基づいて、ベースライン、コード アドレスの実装の準備をします。
実装のアイデアについては、主に論文「知識に基づいたニューラル会話モデル」を参照します。この論文には、次の 2 つの主要な部分が含まれています。
第一に、ナレッジグラフの情報をモデルに埋め込む方法。
2 番目: メモリ メカニズムの実装。
補充:
IJCAI16 の記事「Neural Generative Question Answering」のセクション 3.2 では、入力と KG の間の対話のための 2 つの方法が提案されています。
最初: 双線形モデル
2 番目: CNN ベースのマッチング モデル
参照:
0.www2018、《DKN: Deep Knowledge-Aware Network for News Recommendation》
1. 第 6 回全国ソーシャルメディア処理会議 - SMP2017 中国ヒューマンコンピュータ対話技術評価 (ECDT)
2 つのタスクが含まれます: ユーザー意図ドメイン分類とドメイン固有のタスクベースの人間とコンピューターの対話のオンライン評価
2.《神経会話モデルの多様性を促進する目的関数》
3.《ペルソナベースの神経会話モデル》
4. pytorch を使用したチャットボットのチュートリアル
5.2018 JDDCダイアログコンペ準優勝企画
6. 機械はどうやってユーザーの考えていることを推測できるのでしょうか?アリババXiaomi予測プラットフォームが復号化
7. Alibaba Xiaomi のコアを分解し、インテリジェントな人間とコンピューターのインタラクションの実装ロジックを確認します。
8. その秘密を1記事で暴露!ナレッジ グラフをボトムアップで構築するプロセス全体
9. 電子商取引用に作成されたナレッジ グラフはユーザーのニーズをどのように感知しますか?
10. アリババのエンジニアは健康ナレッジマップをどのように実装していますか?