PsychWordVec
1.0.0
Han-Wu-Shuang (Bruce) Bao Bao Han Wu Shuang
?psychbruce.github.io
library( PsychWordVec )
para o formato APA-7 da sua versão instalada. # # Method 1: Install from CRAN
install.packages( " PsychWordVec " )
# # Method 2: Install from GitHub
install.packages( " devtools " )
devtools :: install_github( " psychbruce/ PsychWordVec " , force = TRUE )
PsychWordVec
embed | wordvec | |
---|---|---|
Aula básica | matriz | dados.tabela |
Tamanho da linha | tamanho do vocabulário | tamanho do vocabulário |
Tamanho da coluna | tamanho da dimensão | 2 (variáveis: word , vec ) |
Vantagem | mais rápido (com operação matricial) | mais fácil de inspecionar e gerenciar |
Função para obter | as_embed() | as_wordvec() |
Função para carregar | load_embed() | load_wordvec() |
: Nota: Incorporação de palavras refere-se a uma técnica de processamento de linguagem natural que incorpora a semântica de palavras em uma matriz de incorporação de baixa dimensão, com cada palavra (na verdade, token) quantificada como um vetor numérico representando seus recursos semânticos (não interpretáveis). vetores dados como a classe embed
usando a função load_embed()
, que normalizaria automaticamente todos os vetores de palavras para o comprimento da unidade 1 (veja a função normalize()
) e aceleraria a execução de a maioria das funções no PsychWordVec
.
PsychWordVec
as_embed()
: de wordvec
(data.table) para embed
(matriz)as_wordvec()
: de embed
(matriz) para wordvec
(data.table)load_embed()
: carrega dados de embeddings de palavras como embed
(matriz)load_wordvec()
: carrega dados de embeddings de palavras como wordvec
(data.table)data_transform()
: transforma vetores de palavras de texto simples em wordvec
ou embed
subset()
: extrai um subconjunto de wordvec
e embed
normalize()
: normaliza todos os vetores de palavras para o comprimento unitário 1get_wordvec()
: extrai vetores de palavrassum_wordvec()
: calcula o vetor soma de várias palavrasplot_wordvec()
: visualiza vetores de palavrasplot_wordvec_tSNE()
: visualização 2D ou 3D com t-SNEorth_procrustes()
: alinhamento da matriz ortogonal de Procrustescosine_similarity()
: cos_sim()
ou cos_dist()
pair_similarity()
: calcula uma matriz de similaridade de pares de palavrasplot_similarity()
: visualiza semelhanças de pares de palavrastab_similarity()
: tabula semelhanças de pares de palavrasmost_similar()
: encontre as N palavras mais semelhantesplot_network()
: visualize um gráfico de rede de palavras (correlação parcial)test_WEAT()
: WEAT e SC-WEAT com teste de permutação de significânciatest_RND()
: RND com teste de permutação de significânciadict_expand()
: expande um dicionário a partir das palavras mais semelhantesdict_reliability()
: análise de confiabilidade e PCA de um dicionáriotokenize()
: tokenizar texto brutotrain_wordvec()
: treina embeddings de palavras estáticastext_init()
: configure um ambiente Python para PLMtext_model_download()
: baixe PLMs do Hugging Face para a pasta local ".cache"text_model_remove()
: remove PLMs da pasta local ".cache"text_to_vec()
: extrai token contextualizado e embeddings de textotext_unmask()
: <obsoleto> <use FMAT> preencha as máscaras em branco em uma consultaConsulte a documentação (páginas de ajuda) para seu uso e detalhes.