Небольшой генератор облаков слов на Python. Подробнее об этом читайте в блоге или на сайте.
Код протестирован на Python 3.7, 3.8, 3.9, 3.10, 3.11, 3.12, 3.13.
Если вы используете пип:
pip install wordcloud
Если вы используете conda, вы можете установить его с канала conda-forge
:
conda install -c conda-forge wordcloud
wordcloud зависит от numpy
, pillow
и matplotlib
.
Если для вашей версии Python нет доступных колес, для установки пакета потребуется настроить компилятор C. Перед установкой компилятора сообщите о проблеме с описанием используемой версии Python и операционной системы.
Посетите example/simple.py для краткого введения. Пример вывода:
Или запустите example/masked.py, чтобы просмотреть дополнительные параметры. Пример вывода:
Немного фантазии с некоторыми цветами:
Создание облаков слов для арабского языка:
Инструмент wordcloud_cli
можно использовать для создания облаков слов непосредственно из командной строки:
$ wordcloud_cli --text mytext.txt --imagefile wordcloud.png
Если вы имеете дело с PDF-файлами, вам пригодится pdftotext
, включенный по умолчанию во многие дистрибутивы Linux:
$ pdftotext mydocument.pdf - | wordcloud_cli --imagefile wordcloud.png
В предыдущем примере аргумент -
приказывает pdftotext
записать результирующий текст на стандартный вывод, который затем передается на стандартный ввод wordcloud_cli.py
.
Используйте wordcloud_cli --help
, чтобы просмотреть все доступные параметры.
Библиотека wordcloud имеет лицензию MIT, но содержит DroidSansMono.ttf, шрифт True Type от Google, имеющий лицензию Apache. Шрифт ни в коем случае не является целостным, и любой другой шрифт можно использовать, задав переменную font_path
при создании объекта WordCloud
.