doc2vec api
1.0.0
リポジトリには、doc2vec を使用してテスト ドキュメント ベクトルをトレーニングおよび推論するためのいくつかのコーパス (韓国語)、Python スクリプトが含まれています。
韓国語 Wikipedia / mecab pos トークナイザー / タグ情報なし / 30 ベクトル(dmpv)
韓国語 Wikipedia / mecab pos トークナイザー / タグ情報なし / 100 ベクトル (dmpv)
韓国語 Wikipedia / mecab pos トークナイザー / タグ情報なし / 300 ベクトル (dmpv)
韓国語 Wikipedia / mecab pos トークナイザー / タグ情報なし / 1000 ベクトル (dmpv)
韓国語 Wikipedia + 金融ニュース / mecab pos トークナイザー / タグ情報なし / 30 ベクトル (dmpv)
韓国語 Wikipedia + 金融ニュース / mecab pos トークナイザー / タグ情報なし / 100 ベクトル (dmpv)
単語埋め込み API を提供するシンプルな Web サービス。このメソッドは Gensim Word2Vec / Doc2Vec 実装に基づいています。モデルはパラメータとして渡され、Word2Vec / Doc2Vec テキストまたはバイナリ形式である必要があります。この web2vec-api スクリプトは、この word2vec-api github からフォークされており、韓国語の word2vec モデルをサポートするためにマイナー アップデートが行われています。
pip2 install -r requirements.txt
python word2vec-api --model path/to/the/model [--host host --port 1234]
ex) python /home/word2vec-api.py --model /home/model/all_terms_50vectors --path /word2vec --host 0.0.0.0 --port 4000
python doc2vec-api --model path/to/the/model [--host host --port 1234]
ex) python /home/doc2vec-api.py --model /home/model/all_terms_50vectors --path /doc2vec --host 0.0.0.0 --port 4000
curl http://127.0.0.1:5000/word2vec/most_similar?positive=무증