PsychWordVecダウンロード - PsychWordVecソースコードのダウンロード

PsychWordVec

AI ソースコード

1.0.0

ダウンロード

PsychWordVec

著者

ハン・ウー・シュアン (ブルース) バオ・バオハン・ウー・シュアン

[email protected]

?psychbruce.github.io

引用

Bao、H.-W.-S. (2022) : 心理科学のための Word 埋め込み研究PsychWordVecワーク。
- 注: これはオリジナルの引用形式です。インストールされているバージョンの APA-7 形式についてはlibrary( PsychWordVec )際の情報を参照してください。
Bao, H.-W.-S.、Wang, Z.-X.、Cheng, X.、Su, Z.、Yang, Y.、Zhang, G.-Y.、Wang, B.、Cai、 H. (2023). 人間の心理を調査するための単語埋め込みの使用:心理科学の進歩、31 (6)、887--904。
[Bao Han、Wu Shuang、Wang Zixi、Cheng Xi、Su Zhan、Yang Ying、Zhang Guangyao、Wang Bo、Cai Huajian (2023)、心理科学の進歩、31。 (6) 、887--904]

インストール

PsychWordVec") ## Method 2: Install from GitHub install.packages("devtools") devtools::install_github("psychbruce/ PsychWordVec ", force=TRUE)">

 # # Method 1: Install from CRAN
install.packages( " PsychWordVec " )

# # Method 2: Install from GitHub
install.packages( " devtools " )
devtools :: install_github( " psychbruce/ PsychWordVec " , force = TRUE )

`PsychWordVec`のデータの種類

	`embed`	`wordvec`
ベーシッククラス	マトリックス	データテーブル
行サイズ	語彙サイズ	語彙サイズ
列サイズ	寸法サイズ	2 (変数: `word` 、 `vec` )
アドバンテージ	より高速（行列演算あり）	検査と管理が容易になる
取得する関数	`as_embed()`	`as_wordvec()`
ロードする関数	`load_embed()`	`load_wordvec()`

: 注: 単語埋め込みとは、単語の意味論を低次元の埋め込み行列に埋め込む自然言語処理技術を指し、各単語 (実際にはトークン) がその (解釈できない) 意味論的な特徴を表す数値ベクトルとして定量化されます。ユーザーは単語をインポートすることをお勧めします。関数load_embed()を使用してデータをembedクラスとしてベクトル化します。これにより、すべての単語ベクトルが単位長1に自動的に正規化され( normalize()関数を参照)、実行が高速化されます。 PsychWordVecのほとんどの関数。

`PsychWordVec`の関数

Word 埋め込みデータの管理と変換
- as_embed() : wordvec (data.table) からembed (行列) へ
- as_wordvec() : embed (行列) からwordvec (data.table) へ
- load_embed() : 単語埋め込みデータをembed (行列) としてロードします
- load_wordvec() : 単語埋め込みデータをwordvec (data.table) としてロードします
- data_transform() : プレーンテキストの単語ベクトルをwordvecまたはembedに変換します。
ワードベクトルの抽出、線形演算、視覚化
- subset() : wordvecのサブセットを抽出してembed
- normalize() : すべての単語ベクトルを単位長 1 に正規化します。
- get_wordvec() : 単語ベクトルを抽出します
- sum_wordvec() : 複数の単語の合計ベクトルを計算します。
- plot_wordvec() : 単語ベクトルを視覚化します。
- plot_wordvec_tSNE() : t-SNE を使用した 2D または 3D 視覚化
- orth_procrustes() : 直交プロクラステス行列の配置
単語の意味的類似性分析、ネットワーク分析、および関連性テスト
- cosine_similarity() : cos_sim()またはcos_dist()
- pair_similarity() : 単語ペアの類似度行列を計算します。
- plot_similarity() : 単語ペアの類似性を視覚化します。
- tab_similarity() : 単語ペアの類似性を表にまとめます
- most_similar() : 上位 N 個の最も類似した単語を検索します
- plot_network() : 単語の (偏相関) ネットワークグラフを視覚化します。
- test_WEAT() : 有意性の順列テストによる WEAT および SC-WEAT
- test_RND() : 有意性の順列テストを伴う RND
辞書自動拡張と信頼性解析
- dict_expand() : 最も類似した単語から辞書を展開します
- dict_reliability() : 辞書の信頼性分析と PCA
静的単語埋め込み (Word2Vec、GloVe、および FastText) のローカルトレーニング
- tokenize() : 生のテキストをトークン化します
- train_wordvec() : 静的な単語埋め込みをトレーニングします
事前トレーニング済み言語モデル (PLM) とコンテキスト化された単語埋め込み
- text_init() : PLM 用の Python 環境をセットアップします。
- text_model_download() : PLM を Hugging Face からローカルの「.cache」フォルダーにダウンロードします
- text_model_remove() : ローカルの「.cache」フォルダーから PLM を削除します
- text_to_vec() : コンテキスト化されたトークンとテキスト埋め込みを抽出します
- text_unmask() : <非推奨> <FMAT を使用してください> クエリに空のマスクを入力します