PsychWordVec -Download - PsychWordVec -Quellcode herunterladen

PsychWordVec

AI-Quellcode

1.0.0

Herunterladen

PsychWordVec

Autor

Han-Wu-Shuang (Bruce) Bao Bao Han Wu Shuang

[email protected]

?psychbruce.github.io

Zitat

Bao, H.-W.-S. (2022) : PsychWordVec für die psychologische Wissenschaft
- Hinweis : Dies ist das ursprüngliche Zitierformat. Bitte beachten Sie die Informationen, wenn Sie library( PsychWordVec ) für das APA-7-Format Ihrer installierten Version verwenden.
Bao, H.-W.-S., Wang, Z.-X., Cheng, X., Su, Z., Yang, Y., Zhang, G.-Y., Wang, B., & Cai, H. (2023). Verwendung von Worteinbettungen zur Untersuchung der menschlichen Psychologie: Methoden und Anwendungen , 31 (6), 887–904.
[Bao Han, Wu Shuang, Wang Zixi, Cheng Xi, Su Zhan , Yang Ying, Zhang Guangyao, Wang Bo, Cai Huajian (2023). (6), 887–904.]

Installation

PsychWordVec") ## Method 2: Install from GitHub install.packages("devtools") devtools::install_github("psychbruce/ PsychWordVec ", force=TRUE)">

 # # Method 1: Install from CRAN
install.packages( " PsychWordVec " )

# # Method 2: Install from GitHub
install.packages( " devtools " )
devtools :: install_github( " psychbruce/ PsychWordVec " , force = TRUE )

Datentypen für `PsychWordVec`

	`embed`	`wordvec`
Grundkurs	Matrix	Datentabelle
Zeilengröße	Wortschatzgröße	Wortschatzgröße
Spaltengröße	Dimensionsgröße	2 (Variablen: `word` , `vec` )
Vorteil	schneller (mit Matrixbetrieb)	einfacher zu prüfen und zu verwalten
Zu erhaltende Funktion	`as_embed()`	`as_wordvec()`
Funktion zum Laden	`load_embed()`	`load_wordvec()`

: Hinweis: Worteinbettung bezieht sich auf eine Technik zur Verarbeitung natürlicher Sprache, die Wortsemantik in eine niedrigdimensionale Einbettungsmatrix einbettet, wobei jedes Wort (eigentlich Token) als numerischer Vektor quantifiziert wird, der seine (nicht interpretierbaren) semantischen Merkmale darstellt. Benutzern wird empfohlen, Wörter zu importieren Vektordaten als embed mithilfe der Funktion load_embed() , die automatisch alle Wortvektoren auf die Einheitslänge 1 normalisiert (siehe Funktion normalize() ) und die Ausführung von beschleunigt die meisten Funktionen in PsychWordVec .

Funktionen in `PsychWordVec`

Word Embeddings Datenmanagement und Transformation
- as_embed() : von wordvec (data.table) nach embed (Matrix)
- as_wordvec() : von embed (Matrix) nach wordvec (Data.table)
- load_embed() : Worteinbettungsdaten als embed (Matrix) laden
- load_wordvec() : Worteinbettungsdaten als wordvec (data.table) laden
- data_transform() : Transformiert Klartext-Wortvektoren in wordvec oder embed
Extraktion von Wortvektoren, lineare Operation und Visualisierung
- subset() : Extrahieren Sie eine Teilmenge von wordvec und embed
- normalize() : Normalisiert alle Wortvektoren auf die Einheitslänge 1
- get_wordvec() : Wortvektoren extrahieren
- sum_wordvec() : Berechnen Sie den Summenvektor mehrerer Wörter
- plot_wordvec() : Wortvektoren visualisieren
- plot_wordvec_tSNE() : 2D- oder 3D-Visualisierung mit t-SNE
- orth_procrustes() : Orthogonale Procrustes-Matrixausrichtung
Wortsemantische Ähnlichkeitsanalyse, Netzwerkanalyse und Assoziationstest
- cosine_similarity() : cos_sim() oder cos_dist()
- pair_similarity() : Berechnen Sie eine Ähnlichkeitsmatrix von Wortpaaren
- plot_similarity() : Visualisiert Ähnlichkeiten von Wortpaaren
- tab_similarity() : Ähnlichkeiten von Wortpaaren tabellarisch darstellen
- most_similar() : Finden Sie die Top-N-Wörter mit der größten Ähnlichkeit
- plot_network() : Visualisieren Sie einen (partiellen Korrelations-)Netzwerkgraphen von Wörtern
- test_WEAT() : WEAT und SC-WEAT mit Permutationstest auf Signifikanz
- test_RND() : RND mit Permutationstest auf Signifikanz
Automatische Wörterbucherweiterung und Zuverlässigkeitsanalyse
- dict_expand() : Erweitern Sie ein Wörterbuch aus den ähnlichsten Wörtern
- dict_reliability() : Zuverlässigkeitsanalyse und PCA eines Wörterbuchs
Lokales Training statischer Worteinbettungen (Word2Vec, GloVe und FastText)
- tokenize() : Rohtext tokenisieren
- train_wordvec() : Statische Worteinbettungen trainieren
Vorab trainierte Sprachmodelle (PLM) und kontextualisierte Worteinbettungen
- text_init() : Richten Sie eine Python-Umgebung für PLM ein
- text_model_download() : PLMs von Hugging Face in den lokalen Ordner „.cache“ herunterladen
- text_model_remove() : PLMs aus dem lokalen Ordner „.cache“ entfernen
- text_to_vec() : kontextualisierte Token- und Texteinbettungen extrahieren
- text_unmask() : <veraltet> <bitte FMAT verwenden> Füllen Sie die leere(n) Maske(n) in einer Abfrage aus