Téléchargement de PsychWordVec - Téléchargement du code source PsychWordVec

PsychWordVec

Code Source AI

1.0.0

Télécharger

PsychWordVec

Auteur

Han-Wu-Shuang (Bruce) Bao Bao Han Wu Shuang

[email protected]

?psychbruce.github.io

Citation

Bao, H.-W.-S. (2022). PsychWordVec : Cadre de recherche d'intégration de mots pour la science psychologique .
- Remarque : Il s'agit du format de citation original. Veuillez vous référer aux informations lorsque vous library( PsychWordVec ) pour le format APA-7 de votre version installée.
Bao, H.-W.-S., Wang, Z.-X., Cheng, X., Su, Z., Yang, Y., Zhang, G.-Y., Wang, B. et Cai, H. (2023). Utilisation de l'intégration de mots pour étudier la psychologie humaine : méthodes et applications , 31 (6), 887--904.
[Bao Han, Wu Shuang, Wang Zixi, Cheng Xi, Su Zhan, Yang Ying, Zhang Guangyao, Wang Bo, Cai Huajian (2023) Recherche psychologique basée sur la technologie d'intégration de mots : méthodes et applications , 31 . (6), 887-904.]

Installation

PsychWordVec") ## Method 2: Install from GitHub install.packages("devtools") devtools::install_github("psychbruce/ PsychWordVec ", force=TRUE)">

 # # Method 1: Install from CRAN
install.packages( " PsychWordVec " )

# # Method 2: Install from GitHub
install.packages( " devtools " )
devtools :: install_github( " psychbruce/ PsychWordVec " , force = TRUE )

Types de données pour `PsychWordVec`

	`embed`	`wordvec`
Cours de base	matrice	données.table
Taille de la ligne	taille du vocabulaire	taille du vocabulaire
Taille de la colonne	dimension taille	2 (variables : `word` , `vec` )
Avantage	plus rapide (avec fonctionnement matriciel)	plus facile à inspecter et à gérer
Fonction pour obtenir	`as_embed()`	`as_wordvec()`
Fonction à charger	`load_embed()`	`load_wordvec()`

: Remarque : L'intégration de mots fait référence à une technique de traitement du langage naturel qui intègre la sémantique des mots dans une matrice d'intégration de faible dimension, chaque mot (en fait un jeton) étant quantifié sous la forme d'un vecteur numérique représentant ses caractéristiques sémantiques (ininterprétables). données de vecteurs en tant que classe embed en utilisant la fonction load_embed() , qui normaliserait automatiquement tous les vecteurs de mots à la longueur unitaire 1 (voir la fonction normalize() ) et accélérerait l'exécution de la plupart des fonctions dans PsychWordVec .

Fonctions dans `PsychWordVec`

Gestion et transformation des données Word Embeddings
- as_embed() : de wordvec (data.table) à embed (matrice)
- as_wordvec() : de embed (matrice) à wordvec (data.table)
- load_embed() : charger les données d'intégration de mots en tant embed (matrice)
- load_wordvec() : charge les données d'intégration de mots en tant que wordvec (data.table)
- data_transform() : transformer les vecteurs de mots en texte brut en wordvec ou embed
Extraction de vecteurs de mots, opération linéaire et visualisation
- subset() : extraire un sous-ensemble de wordvec et embed
- normalize() : normalise tous les vecteurs de mots à la longueur unitaire 1
- get_wordvec() : extraire les vecteurs de mots
- sum_wordvec() : calcule le vecteur somme de plusieurs mots
- plot_wordvec() : visualiser les vecteurs de mots
- plot_wordvec_tSNE() : visualisation 2D ou 3D avec t-SNE
- orth_procrustes() : Alignement orthogonal de la matrice de Procruste
Analyse de similarité sémantique des mots, analyse de réseau et test d'association
- cosine_similarity() : cos_sim() ou cos_dist()
- pair_similarity() : calcule une matrice de similarité de paires de mots
- plot_similarity() : visualisez les similitudes des paires de mots
- tab_similarity() : tabuler les similitudes des paires de mots
- most_similar() : recherche les N mots les plus similaires
- plot_network() : visualiser un graphique de réseau (corrélation partielle) de mots
- test_WEAT() : WEAT et SC-WEAT avec test de permutation de signification
- test_RND() : RND avec test de permutation de signification
Expansion automatique du dictionnaire et analyse de fiabilité
- dict_expand() : développe un dictionnaire à partir des mots les plus similaires
- dict_reliability() : analyse de fiabilité et ACP d'un dictionnaire
Formation locale des intégrations de mots statiques (Word2Vec, GloVe et FastText)
- tokenize() : tokeniser le texte brut
- train_wordvec() : entraîner des intégrations de mots statiques
Modèles de langage pré-entraînés (PLM) et intégrations de mots contextualisés
- text_init() : mettre en place un environnement Python pour PLM
- text_model_download() : télécharge les PLM de Hugging Face vers le dossier local ".cache"
- text_model_remove() : supprime les PLM du dossier local ".cache"
- text_to_vec() : extraire le jeton contextualisé et les intégrations de texte
- text_unmask() : <obsolète> <veuillez utiliser FMAT> remplissez le(s) masque(s) vide(s) dans une requête