Um pequeno gerador de nuvem de palavras em Python. Leia mais sobre isso na postagem do blog ou no site.
O código é testado em Python 3.7, 3.8, 3.9, 3.10, 3.11, 3.12, 3.13.
Se você estiver usando pip:
pip install wordcloud
Se você estiver usando o conda, poderá instalar a partir do canal conda-forge
:
conda install -c conda-forge wordcloud
wordcloud depende de numpy
, pillow
e matplotlib
.
Se não houver rodas disponíveis para sua versão do python, a instalação do pacote requer a configuração de um compilador C. Antes de instalar um compilador, relate um problema descrevendo a versão do python e o sistema operacional que está sendo usado.
Confira exemplos/simple.py para uma breve introdução. Um exemplo de saída é:
Ou execute exemplos/masked.py para ver mais opções. Um exemplo de saída é:
Ficando chique com algumas cores:
Gerando nuvens de palavras para árabe:
A ferramenta wordcloud_cli
pode ser usada para gerar nuvens de palavras diretamente da linha de comando:
$ wordcloud_cli --text mytext.txt --imagefile wordcloud.png
Se você estiver lidando com arquivos PDF, então pdftotext
, incluído por padrão em muitas distribuições Linux, é útil:
$ pdftotext mydocument.pdf - | wordcloud_cli --imagefile wordcloud.png
No exemplo anterior, o argumento -
ordena que pdftotext
grave o texto resultante em stdout, que é então canalizado para o stdin de wordcloud_cli.py
.
Use wordcloud_cli --help
para ver todas as opções disponíveis.
A biblioteca wordcloud é licenciada pelo MIT, mas contém DroidSansMono.ttf, uma fonte true type do Google, licenciada pelo Apache. A fonte não é de forma alguma integral e qualquer outra fonte pode ser usada definindo a variável font_path
ao criar um objeto WordCloud
.