PsychWordVec
1.0.0
한우솽(브루스) 바오바오 한우솽
?psychbruce.github.io
library( PsychWordVec )
를 참조하십시오. # # Method 1: Install from CRAN
install.packages( " PsychWordVec " )
# # Method 2: Install from GitHub
install.packages( " devtools " )
devtools :: install_github( " psychbruce/ PsychWordVec " , force = TRUE )
PsychWordVec
의 데이터 유형 embed | wordvec | |
---|---|---|
기본수업 | 행렬 | 데이터.테이블 |
행 크기 | 어휘 크기 | 어휘 크기 |
열 크기 | 치수 크기 | 2 (변수: word , vec ) |
이점 | 더 빠르게(매트릭스 연산 사용) | 검사 및 관리가 더 쉬워졌습니다. |
얻을 수 있는 기능 | as_embed() | as_wordvec() |
로드하는 기능 | load_embed() | load_wordvec() |
: 참고: 단어 임베딩은 단어 의미를 저차원 임베딩 행렬 에 삽입하는 자연어 처리 기술을 의미하며, 각 단어(실제로 토큰)는 해당(해석할 수 없는) 의미 특징을 나타내는 숫자 벡터 로 정량화됩니다. 모든 단어 벡터를 단위 길이 1로 자동 정규화하고( normalize()
함수 참조) 실행을 가속화하는 load_embed()
함수를 사용하여 데이터를 embed
클래스로 벡터화합니다. PsychWordVec
의 대부분의 기능.
PsychWordVec
의 기능as_embed()
: wordvec
(data.table)에서 embed
(행렬)로as_wordvec()
: embed
(행렬)에서 wordvec
(data.table)로load_embed()
: 단어 삽입 데이터를 embed
(행렬)으로 로드합니다.load_wordvec()
: 단어 임베딩 데이터를 wordvec
(data.table)로 로드합니다.data_transform()
: 일반 텍스트 단어 벡터를 wordvec
또는 embed
로 변환합니다.subset()
: wordvec
의 하위 집합을 추출하고 embed
normalize()
: 모든 단어 벡터를 단위 길이 1로 정규화합니다.get_wordvec()
: 단어 벡터 추출sum_wordvec()
: 여러 단어의 합계 벡터를 계산합니다.plot_wordvec()
: 단어 벡터 시각화plot_wordvec_tSNE()
: t-SNE를 사용한 2D 또는 3D 시각화orth_procrustes()
: 직교 프로크루스테스 행렬 정렬cosine_similarity()
: cos_sim()
또는 cos_dist()
pair_similarity()
: 단어 쌍의 유사성 행렬을 계산합니다.plot_similarity()
: 단어 쌍의 유사성을 시각화합니다.tab_similarity()
: 단어 쌍의 유사성을 표로 작성합니다.most_similar()
: Top-N 가장 유사한 단어를 찾습니다.plot_network()
: 단어의 (부분 상관) 네트워크 그래프를 시각화합니다.test_WEAT()
: 유의성 순열 테스트가 포함된 WEAT 및 SC-WEATtest_RND()
: 유의성 순열 테스트가 포함된 RNDdict_expand()
: 가장 유사한 단어로 사전을 확장합니다.dict_reliability()
: 사전의 신뢰도 분석 및 PCAtokenize()
: 원시 텍스트를 토큰화합니다.train_wordvec()
: 정적 단어 임베딩 훈련text_init()
: PLM용 Python 환경 설정text_model_download()
: Hugging Face에서 로컬 ".cache" 폴더로 PLM을 다운로드합니다.text_model_remove()
: 로컬 ".cache" 폴더에서 PLM을 제거합니다.text_to_vec()
: 상황에 맞는 토큰 및 텍스트 임베딩을 추출합니다.text_unmask()
: <더 이상 사용되지 않음> <FMAT를 사용하세요> 쿼리에 빈 마스크를 입력하세요.사용법과 자세한 내용은 설명서(도움말 페이지)를 참조하세요.