ดาวน์โหลด PsychWordVec - ดาวน์โหลดซอร์สโค้ด PsychWordVec

PsychWordVec

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

PsychWordVec

ผู้เขียน

ฮั่นอู่ซวง (บรูซ) เปาเปา ฮันอู๋ซวง

[email protected]

?psychbruce.github.io

การอ้างอิง

Bao, H.-W.-S. (2022). PsychWordVec : การฝังคำกรอบการวิจัยสำหรับวิทยาศาสตร์จิตวิทยา
- หมายเหตุ : นี่เป็นรูปแบบการอ้างอิงดั้งเดิม โปรดดูข้อมูลเมื่อคุณ library( PsychWordVec ) สำหรับรูปแบบ APA-7 ของเวอร์ชันที่คุณติดตั้ง
Bao, H.-W.-S., Wang, Z.-X., Cheng, X., Su, Z., Yang, Y., Zhang, G.-Y., Wang, B., & Cai, H. (2023) การใช้การฝังคำเพื่อตรวจสอบ จิตวิทยา มนุษย์: วิธีการและการประยุกต์.
[Bao Han, Wu Shuang, Wang Zixi, Cheng Xi, Su Zhan, Yang Ying, Zhang Guangyao, Wang Bo, Cai Huajian (2023) การวิจัยทาง จิตวิทยา โดยใช้เทคโนโลยีการฝังคำ: วิธีการและการประยุกต์ (6) , 887--904.]

การติดตั้ง

PsychWordVec") ## Method 2: Install from GitHub install.packages("devtools") devtools::install_github("psychbruce/ PsychWordVec ", force=TRUE)">

 # # Method 1: Install from CRAN
install.packages( " PsychWordVec " )

# # Method 2: Install from GitHub
install.packages( " devtools " )
devtools :: install_github( " psychbruce/ PsychWordVec " , force = TRUE )

ประเภทของข้อมูลสำหรับ `PsychWordVec`

	`embed`	`wordvec`
ชั้นเรียนขั้นพื้นฐาน	เมทริกซ์	ข้อมูล.ตาราง
ขนาดแถว	ขนาดคำศัพท์	ขนาดคำศัพท์
ขนาดคอลัมน์	ขนาดมิติ	2 (ตัวแปร: `word` , `vec` )
ข้อได้เปรียบ	เร็วขึ้น (ด้วยการทำงานของเมทริกซ์)	ตรวจสอบและจัดการได้ง่ายขึ้น
ฟังก์ชั่นที่จะได้รับ	`as_embed()`	`as_wordvec()`
ฟังก์ชั่นในการโหลด	`load_embed()`	`load_wordvec()`

: หมายเหตุ: การฝังคำหมายถึงเทคนิคการประมวลผลภาษาธรรมชาติที่ฝังความหมายของคำลงใน เมทริกซ์การฝังมิติ ต่ำ โดยแต่ละคำ (จริงๆ แล้วโทเค็น) จะถูกระบุปริมาณเป็น เวกเตอร์ตัวเลข ที่แสดงถึงคุณลักษณะทางความหมาย (ไม่สามารถตีความได้) ข้อมูลเวกเตอร์เป็นคลาส embed โดยใช้ฟังก์ชัน load_embed() ซึ่งจะปรับเวกเตอร์คำทั้งหมดให้เป็นมาตรฐานโดยอัตโนมัติตามความยาวหน่วย 1 (ดูฟังก์ชัน normalize() ) และเร่งการทำงานของ ฟังก์ชั่นส่วนใหญ่ใน PsychWordVec .

ฟังก์ชั่นใน `PsychWordVec`

Word Embeddings การจัดการข้อมูลและการเปลี่ยนแปลง
- as_embed() : จาก wordvec (data.table) ถึง embed (เมทริกซ์)
- as_wordvec() : จาก embed (เมทริกซ์) ถึง wordvec (data.table)
- load_embed() : โหลดข้อมูลการฝังคำเป็นแบบ embed (เมทริกซ์)
- load_wordvec() : โหลดข้อมูลการฝังคำเป็น wordvec (data.table)
- data_transform() : แปลงเวกเตอร์คำข้อความธรรมดาเป็น wordvec หรือ embed
การแยกคำเวกเตอร์ การดำเนินการเชิงเส้น และการแสดงภาพ
- subset() : แยกชุดย่อยของ wordvec และ embed
- normalize() : ทำให้เวกเตอร์คำทั้งหมดเป็นมาตรฐานตามความยาวหน่วย 1
- get_wordvec() : แยกเวกเตอร์คำ
- sum_wordvec() : คำนวณเวกเตอร์ผลรวมของคำหลายคำ
- plot_wordvec() : แสดงภาพเวกเตอร์คำ
- plot_wordvec_tSNE() : การสร้างภาพ 2D หรือ 3D ด้วย t-SNE
- orth_procrustes() : การจัดตำแหน่งเมทริกซ์ Orthogonal Procrustes
การวิเคราะห์ความคล้ายคลึงกันทางความหมายของคำ การวิเคราะห์เครือข่าย และการทดสอบการเชื่อมโยง
- cosine_similarity() : cos_sim() หรือ cos_dist()
- pair_similarity() : คำนวณเมทริกซ์ความคล้ายคลึงของคู่คำ
- plot_similarity() : แสดงภาพความคล้ายคลึงกันของคู่คำ
- tab_similarity() : จัดตารางความคล้ายคลึงกันของคู่คำ
- most_similar() : ค้นหาคำที่มี Top-N คล้ายกันมากที่สุด
- plot_network() : แสดงภาพกราฟเครือข่ายของคำ (ความสัมพันธ์บางส่วน)
- test_WEAT() : WEAT และ SC-WEAT พร้อมการทดสอบการเรียงสับเปลี่ยนนัยสำคัญ
- test_RND() : RND พร้อมการทดสอบการเรียงสับเปลี่ยนนัยสำคัญ
การวิเคราะห์การขยายพจนานุกรมอัตโนมัติและความน่าเชื่อถือ
- dict_expand() : ขยายพจนานุกรมจากคำที่คล้ายกันมากที่สุด
- dict_reliability() : การวิเคราะห์ความน่าเชื่อถือและ PCA ของพจนานุกรม
การฝึกอบรมท้องถิ่นของการฝังคำแบบคงที่ (Word2Vec, GloVe และ FastText)
- tokenize() : tokenize ข้อความดิบ
- train_wordvec() : ฝึกการฝังคำแบบคงที่
โมเดลภาษาที่ได้รับการฝึกอบรมล่วงหน้า (PLM) และการฝังคำตามบริบท
- text_init() : ตั้งค่าสภาพแวดล้อม Python สำหรับ PLM
- text_model_download() : ดาวน์โหลด PLM จาก Hugging Face ไปยังโฟลเดอร์ ".cache" ในเครื่อง
- text_model_remove() : ลบ PLM ออกจากโฟลเดอร์ ".cache" ในเครื่อง
- text_to_vec() : แยกโทเค็นตามบริบทและการฝังข้อความ
- text_unmask() : <deprecated> <please use FMAT> กรอกมาสก์ว่างในแบบสอบถาม