グラフ表現学習における否定的なサンプリングの理解。
Zhen Yang*、Ming Ding*、Chang Zhou、Hongxia Yang、Jingren Zhou、Jie Tang。 (*これらの著者は、この作業に平等に貢献しました。)
KDD 2020(研究トラック)
目的とリスクの両方の観点から否定的なサンプリングの役割を体系的に分析し、否定的なサンプリング分布は正のサンプリング分布と正の相関があるが、それ以下のサンプリング分布と相関する必要があることを定量化します。理論のガイダンスにより、MCNSを提案し、自己制御近似で正の分布を近似し、メトロポリスハーストによる否定的なサンプリングを加速します。
$ ./experiments/graphsage/***.sh
を使用して、推奨タスクでMCNSモデルをトレーニングできます。たとえば、Amazon Datasetでトレーニングする場合は、 $ ./experiments/graphsage/amazon.sh
またはpython main.py --input data/amazon/ --model graphsage_mean
実行できます。
$ ./experiments/deepwalk/***.sh
を使用して、推奨タスクでMCNSモデルをトレーニングできます。たとえば、ML-100Kデータセットでトレーニングしたい場合は、 $ ./experiments/deepwalk/ml.sh
またはpython main.py --input data/ml-100k/ --model deepwalk
実行できます。 。
$ ./experiments/gcn.sh
を使用して、推奨タスクのためにML-100KデータセットでMCNSモデルをトレーニングできます。
独自のデータセットでMCNSをトレーニングする場合は、次の4つのファイルを準備する必要があります。
<node1> <node2>
を表します。(generated by load_data.py/load_test_neg function).
コードのトレーニング可能なエンコーダーは、グラフセージに基づいています。
このコードが研究に役立つ場合は、私たちの論文を引用してください。
@misc{yang2020understanding,
Author = {Zhen Yang and Ming Ding and Chang Zhou and Hongxia Yang and Jingren Zhou and Jie Tang},
Title = {Understanding Negative Sampling in Graph Representation Learning},
Year = {2020},
Eprint = {arXiv:2005.09863},
}