พื้นที่เก็บข้อมูลประกอบด้วยสคริปต์คลังข้อมูล (ภาษาเกาหลี) และสคริปต์หลามสำหรับการฝึกอบรมและการอนุมานเวกเตอร์เอกสารทดสอบโดยใช้ doc2vec
Wikipedia ภาษาเกาหลี / mecab pos tokenizer / ไม่มีข้อมูลแท็ก / 30 เวกเตอร์ (dmpv)
Wikipedia ภาษาเกาหลี / mecab pos tokenizer / ไม่มีข้อมูลแท็ก / 100 เวกเตอร์ (dmpv)
Wikipedia ภาษาเกาหลี / mecab pos tokenizer / ไม่มีข้อมูลแท็ก / 300 เวกเตอร์ (dmpv)
Wikipedia ภาษาเกาหลี / mecab pos tokenizer / ไม่มีข้อมูลแท็ก / 1,000 เวกเตอร์ (dmpv)
วิกิพีเดียภาษาเกาหลี + ข่าวการเงิน / mecab pos tokenizer / ไม่มีข้อมูลแท็ก / 30 เวกเตอร์ (dmpv)
วิกิพีเดียภาษาเกาหลี + ข่าวการเงิน / mecab pos tokenizer / ไม่มีข้อมูลแท็ก / 100 เวกเตอร์ (dmpv)
บริการเว็บที่เรียบง่ายซึ่งมี API การฝังคำ วิธีการนี้ขึ้นอยู่กับการใช้งาน Gensim Word2Vec / Doc2Vec โมเดลจะถูกส่งผ่านเป็นพารามิเตอร์ และต้องอยู่ในข้อความ Word2Vec / Doc2Vec หรือรูปแบบไบนารี สคริปต์ web2vec-api นี้แยกจาก word2vec-api github นี้ และได้รับการอัปเดตเล็กน้อยเพื่อรองรับโมเดล word2vec ภาษาเกาหลี
pip2 install -r requirements.txt
python word2vec-api --model path/to/the/model [--host host --port 1234]
ex) python /home/word2vec-api.py --model /home/model/all_terms_50vectors --path /word2vec --host 0.0.0.0 --port 4000
python doc2vec-api --model path/to/the/model [--host host --port 1234]
ex) python /home/doc2vec-api.py --model /home/model/all_terms_50vectors --path /doc2vec --host 0.0.0.0 --port 4000
curl http://127.0.0.1:5000/word2vec/most_similar?positive=무증