doc2vec api
1.0.0
该存储库包含一些语料库(韩语)、Python 脚本,用于使用 doc2vec 进行训练和推断测试文档向量。
韩语维基百科 / mecab pos tokenizer / 无标签信息 / 30 个向量(dmpv)
韩语维基百科 / mecab pos tokenizer / 无标签信息 / 100 个向量(dmpv)
韩语维基百科 / mecab pos tokenizer / 无标签信息 / 300 个向量(dmpv)
韩语维基百科 / mecab pos tokenizer / 无标签信息 / 1000 个向量(dmpv)
韩语维基百科 + 财经新闻 / mecab pos tokenizer / 无标签信息 / 30 个向量(dmpv)
韩语维基百科 + 财经新闻 / mecab pos tokenizer / 无标签信息 / 100 个向量(dmpv)
提供词嵌入 API 的简单 Web 服务。这些方法基于 Gensim Word2Vec / Doc2Vec 实现。模型作为参数传递,并且必须采用 Word2Vec / Doc2Vec 文本或二进制格式。这个 web2vec-api 脚本是从这个 word2vec-api github 分支出来的,并进行了小更新以支持韩语 word2vec 模型。
pip2 install -r requirements.txt
python word2vec-api --model path/to/the/model [--host host --port 1234]
ex) python /home/word2vec-api.py --model /home/model/all_terms_50vectors --path /word2vec --host 0.0.0.0 --port 4000
python doc2vec-api --model path/to/the/model [--host host --port 1234]
ex) python /home/doc2vec-api.py --model /home/model/all_terms_50vectors --path /doc2vec --host 0.0.0.0 --port 4000
curl http://127.0.0.1:5000/word2vec/most_similar?positive=무증