Download PsychWordVec - Download do código-fonte PsychWordVec

PsychWordVec

Código-Fonte de IA

1.0.0

Baixar

PsychWordVec

Autor

Han-Wu-Shuang (Bruce) Bao Bao Han Wu Shuang

[email protected]

?psychbruce.github.io

Citação

Bao, H.-W.-S. (2022). PsychWordVec : Estrutura de pesquisa de incorporação de palavras para ciência psicológica .
- Nota : Este é o formato de citação original. Consulte as informações ao usar library( PsychWordVec ) para o formato APA-7 da sua versão instalada.
Bao, H.-W.-S., Wang, Z.-X., Cheng, X., Su, Z., Yang, Y., Zhang, G.-Y., Wang, B., & Cai, H. (2023). Usando incorporações de palavras para investigar a psicologia humana: Métodos e aplicações.
[Bao Han, Wu Shuang, Wang Zixi, Cheng Xi, Su Zhan , Yang Ying, Zhang Guangyao, Wang Bo, Cai Huajian (2023). (6), 887--904.]

Instalação

PsychWordVec") ## Method 2: Install from GitHub install.packages("devtools") devtools::install_github("psychbruce/ PsychWordVec ", force=TRUE)">

 # # Method 1: Install from CRAN
install.packages( " PsychWordVec " )

# # Method 2: Install from GitHub
install.packages( " devtools " )
devtools :: install_github( " psychbruce/ PsychWordVec " , force = TRUE )

Tipos de dados para `PsychWordVec`

	`embed`	`wordvec`
Aula básica	matriz	dados.tabela
Tamanho da linha	tamanho do vocabulário	tamanho do vocabulário
Tamanho da coluna	tamanho da dimensão	2 (variáveis: `word` , `vec` )
Vantagem	mais rápido (com operação matricial)	mais fácil de inspecionar e gerenciar
Função para obter	`as_embed()`	`as_wordvec()`
Função para carregar	`load_embed()`	`load_wordvec()`

: Nota: Incorporação de palavras refere-se a uma técnica de processamento de linguagem natural que incorpora a semântica de palavras em uma matriz de incorporação de baixa dimensão, com cada palavra (na verdade, token) quantificada como um vetor numérico representando seus recursos semânticos (não interpretáveis). vetores dados como a classe embed usando a função load_embed() , que normalizaria automaticamente todos os vetores de palavras para o comprimento da unidade 1 (veja a função normalize() ) e aceleraria a execução de a maioria das funções no PsychWordVec .

Funções em `PsychWordVec`

Gerenciamento e transformação de dados de incorporações de palavras
- as_embed() : de wordvec (data.table) para embed (matriz)
- as_wordvec() : de embed (matriz) para wordvec (data.table)
- load_embed() : carrega dados de embeddings de palavras como embed (matriz)
- load_wordvec() : carrega dados de embeddings de palavras como wordvec (data.table)
- data_transform() : transforma vetores de palavras de texto simples em wordvec ou embed
Extração de vetores de palavras, operação linear e visualização
- subset() : extrai um subconjunto de wordvec e embed
- normalize() : normaliza todos os vetores de palavras para o comprimento unitário 1
- get_wordvec() : extrai vetores de palavras
- sum_wordvec() : calcula o vetor soma de várias palavras
- plot_wordvec() : visualiza vetores de palavras
- plot_wordvec_tSNE() : visualização 2D ou 3D com t-SNE
- orth_procrustes() : alinhamento da matriz ortogonal de Procrustes
Análise de similaridade semântica de palavras, análise de rede e teste de associação
- cosine_similarity() : cos_sim() ou cos_dist()
- pair_similarity() : calcula uma matriz de similaridade de pares de palavras
- plot_similarity() : visualiza semelhanças de pares de palavras
- tab_similarity() : tabula semelhanças de pares de palavras
- most_similar() : encontre as N palavras mais semelhantes
- plot_network() : visualize um gráfico de rede de palavras (correlação parcial)
- test_WEAT() : WEAT e SC-WEAT com teste de permutação de significância
- test_RND() : RND com teste de permutação de significância
Expansão Automática de Dicionário e Análise de Confiabilidade
- dict_expand() : expande um dicionário a partir das palavras mais semelhantes
- dict_reliability() : análise de confiabilidade e PCA de um dicionário
Treinamento local de incorporações estáticas de palavras (Word2Vec, GloVe e FastText)
- tokenize() : tokenizar texto bruto
- train_wordvec() : treina embeddings de palavras estáticas
Modelos de linguagem pré-treinados (PLM) e incorporações de palavras contextualizadas
- text_init() : configure um ambiente Python para PLM
- text_model_download() : baixe PLMs do Hugging Face para a pasta local ".cache"
- text_model_remove() : remove PLMs da pasta local ".cache"
- text_to_vec() : extrai token contextualizado e embeddings de texto
- text_unmask() : <obsoleto> <use FMAT> preencha as máscaras em branco em uma consulta