การคำนวณคือความสามารถในการจัดการกับตัวเลขและตัวเลข โครงการนี้ตรวจสอบกลยุทธ์ต่าง ๆ สำหรับแบบจำลองภาษาเพื่อทำนายตัวเลข แบบจำลองได้รับการฝึกฝนและทดสอบในชุดข้อมูลทางคลินิกและวิทยาศาสตร์
Georgios Spithourakis และ Sebastian Riedel ตัวเลขสำหรับแบบจำลองภาษา: การประเมินและปรับปรุงความสามารถในการทำนายตัวเลข ACL 2018
PIP ติดตั้ง BeautifulSoup4
PIP ติดตั้ง lxml (สำหรับ windows ดาวน์โหลดจาก http://www.lfd.uci.edu/~gohlke/pythonlibs/)
PIP Install Spacy (อาจต้องการเพิ่มเติม: Conda ติดตั้ง libgcc)
Python -m Spacy Download en
ถุงมือฝังตัวจาก: https://nlp.stanford.edu/projects/glove/
looxml.download_arxmliv.py
[ชุดข้อมูล] .Extract_to_json.py
looxml.xml_to_text.py
json_to_tsv.py
tsv_to_annotated.py
[ชุดข้อมูล] .tables_to_processed.py
tables_processed_to_annotated.py
DataSet.common.join_all.py
preproc.build_vocab.py
preproc.bucketing.py
Python lm_jtr.py
-ข้อมูล [คลินิก | arxmliv]
-train number_of_epochs
-แบทช์ batch_size
-config [a1 | a2 | a3 | a4 | b1 | b2 | c1] # กลยุทธ์สำหรับการส่งออกตัวเลข (อนุมานได้หากโหลดแบบจำลอง)
-ไม่มีการทดสอบ # เพื่อระงับการประเมินเวลาทดสอบ
-ไม่มีการตรวจสอบ # เพื่อระงับการวินิจฉัย (แปลงค่าตัวกลาง ฯลฯ )
-โหลด A1_2018_02_17_16_50_13_Clinical
เช่น
Python lm_jtr.py-data arxmliv-ไม่มีการตรวจสอบ-ไม่ทดสอบ-TRAIN 500-BATCH 50-Config A1 # รุ่นรถไฟ
Python LM_JTR.PY-DATA ARXMLIV-NO-Inspect-โหลด A1_2018_02_18_11_55_11_ARXMLIV # รุ่นทดสอบ
Python lm_jtr.py-data arxmliv-ไม่ทดสอบ-โหลด A1_2018_02_18_11_55_11_ARXMLIV # รับพล็อตและการวินิจฉัยอื่น ๆ
A1: Softmax
A2: SoftMax+RNN
A3: H-softmax
A4: H-Softmax+RNN
B1: D-RNN
B2: MOG
C1: การรวมกัน