Ein kleiner Wortwolkengenerator in Python. Lesen Sie mehr darüber im Blogbeitrag oder auf der Website.
Der Code wurde gegen Python 3.7, 3.8, 3.9, 3.10, 3.11, 3.12, 3.13 getestet.
Wenn Sie pip verwenden:
pip install wordcloud
Wenn Sie Conda verwenden, können Sie über den conda-forge
-Kanal installieren:
conda install -c conda-forge wordcloud
Wordcloud hängt von numpy
, pillow
und matplotlib
ab.
Wenn für Ihre Python-Version keine Räder verfügbar sind, erfordert die Installation des Pakets die Einrichtung eines C-Compilers. Melden Sie vor der Installation eines Compilers ein Problem mit einer Beschreibung der verwendeten Python-Version und des Betriebssystems.
Eine kurze Einführung finden Sie unter „examples/simple.py“. Eine Beispielausgabe ist:
Oder führen Sie „examples/masked.py“ aus, um weitere Optionen anzuzeigen. Eine Beispielausgabe ist:
Machen Sie es sich mit ein paar Farben schick:
Wortwolken für Arabisch erstellen:
Mit dem Tool wordcloud_cli
können Wortwolken direkt über die Befehlszeile generiert werden:
$ wordcloud_cli --text mytext.txt --imagefile wordcloud.png
Wenn Sie mit PDF-Dateien arbeiten, ist pdftotext
praktisch, das standardmäßig in vielen Linux-Distributionen enthalten ist:
$ pdftotext mydocument.pdf - | wordcloud_cli --imagefile wordcloud.png
Im vorherigen Beispiel weist das Argument -
pdftotext
an, den resultierenden Text nach stdout zu schreiben, der dann an den stdin von wordcloud_cli.py
weitergeleitet wird.
Verwenden Sie wordcloud_cli --help
, um alle verfügbaren Optionen anzuzeigen.
Die Wordcloud-Bibliothek ist MIT-lizenziert, enthält jedoch DroidSansMono.ttf, eine True-Type-Schriftart von Google, die unter der Apache-Lizenz steht. Die Schriftart ist keineswegs integral und jede andere Schriftart kann verwendet werden, indem beim Erstellen eines WordCloud
Objekts die Variable font_path
festgelegt wird.