Python による小さなワード クラウド ジェネレーター。詳細については、ブログ投稿または Web サイトをご覧ください。
コードは Python 3.7、3.8、3.9、3.10、3.11、3.12、3.13 に対してテストされています。
pip を使用している場合:
pip install wordcloud
conda を使用している場合は、 conda-forge
チャネルからインストールできます。
conda install -c conda-forge wordcloud
wordcloud はnumpy
、 pillow
、およびmatplotlib
に依存します。
使用しているバージョンの Python で利用可能なホイールがない場合、パッケージをインストールするには C コンパイラをセットアップする必要があります。コンパイラーをインストールする前に、使用されている Python のバージョンとオペレーティング システムを説明した問題を報告してください。
短い紹介については、examples/simple.py をチェックしてください。出力例は次のとおりです。
または、examples/masked.py を実行して、その他のオプションを表示します。出力例は次のとおりです。
いくつかの色で派手に:
アラビア語のワードクラウドの生成:
wordcloud_cli
ツールを使用すると、コマンドラインから直接ワード クラウドを生成できます。
$ wordcloud_cli --text mytext.txt --imagefile wordcloud.png
PDF ファイルを扱う場合は、多くの Linux ディストリビューションにデフォルトで含まれているpdftotext
が便利です。
$ pdftotext mydocument.pdf - | wordcloud_cli --imagefile wordcloud.png
前の例では、 -
引数は、結果のテキストを stdout に書き込むようにpdftotext
に命令し、それがwordcloud_cli.py
の stdin にパイプされます。
wordcloud_cli --help
を使用すると、利用可能なすべてのオプションが表示されます。
Wordcloud ライブラリは MIT ライセンスを取得していますが、Apache ライセンスを取得した Google の True Type フォントである DroidSansMono.ttf が含まれています。フォントは決して統合されたものではなく、 WordCloud
オブジェクトの作成時にfont_path
変数を設定することで他のフォントを使用できます。