английский | испанский | Французский | немецкий | 中文 | тюркче | 日本語 | 한국어
PyGWalker может упростить рабочий процесс анализа и визуализации данных Jupyter Notebook, превратив фрейм данных pandas в интерактивный пользовательский интерфейс для визуального исследования.
PyGWalker (просто для развлечения произносится как «Pig Walker») назван как аббревиатура от « Pythonbinding of Graphic Walker ». Он интегрирует Jupyter Notebook с Graphic Walker, альтернативой Tableau с открытым исходным кодом. Он позволяет специалистам по данным визуализировать/очищать/аннотировать данные с помощью простых операций перетаскивания и даже запросов на естественном языке.
Посетите Google Colab, Kaggle Code или онлайн-демонстрацию Graphic Walker, чтобы проверить это!
Если вы предпочитаете использовать R, проверьте GWalkR, оболочку R для Graphic Walker.
Посмотрите наше видеоруководство по использованию pygwalker, pygwalker +streamlit и pygwalker + Snowflake. Как исследовать данные с помощью PyGWalker в Python.
Бегать в Kaggle | Запустить в Колабе |
---|---|
Перед использованием pygwalker обязательно установите пакеты через командную строку, используя pip или conda.
pip установить pygwalker
Примечание
Для ранней пробной версии вы можете установить с помощью
pip install pygwalker --upgrade
, чтобы поддерживать вашу версию в актуальном состоянии до последней версии, или дажеpip install pygwalker --upgrade --pre
чтобы получить новейшие функции и исправления ошибок.
установка conda -c conda-forge pygwalker
или
установка мамбы -c conda-forge pygwalker
Дополнительную информацию см. в разделе «Исходное сырье conda-forge».
Чтобы начать работу, импортируйте pygwalker и pandas в свой блокнот Jupyter.
импортировать панд как pdimport pygwalker как pyg
Вы можете использовать pygwalker, не нарушая существующий рабочий процесс. Например, вы можете вызвать PyGWalker с загруженным фреймом данных следующим образом:
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df)
Вот и все. Теперь у вас есть интерактивный пользовательский интерфейс для анализа и визуализации данных с помощью простых операций перетаскивания.
Крутые вещи, которые вы можете сделать с PyGwalker:
Вы можете изменить тип метки на другой, чтобы построить разные диаграммы, например, линейную диаграмму:
Чтобы сравнить различные меры, вы можете создать объединенное представление, добавив более одной меры в строки/столбцы.
Чтобы создать фасетное представление нескольких подпредставлений, разделенных по значению в измерении, поместите измерения в строки или столбцы, чтобы создать фасетное представление.
PyGWalker содержит мощную таблицу данных, которая обеспечивает быстрый просмотр данных и их распределение, профилирование. Вы также можете добавить фильтры или изменить типы данных в таблице.
Вы можете сохранить результат исследования данных в локальный файл.
Есть несколько важных параметров, которые вам следует знать при использовании pygwalker:
spec
: для сохранения/загрузки конфигурации диаграммы (строка JSON или путь к файлу)
kernel_computation
: для использования DuckDB в качестве вычислительного механизма, который позволяет вам быстрее обрабатывать больший набор данных на вашем локальном компьютере.
use_kernel_calc
: устарело, вместо этого используйте kernel_computation
.
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df,spec="./chart_meta_0.json", # этот json-файл сохранит состояние вашей диаграммы, вам нужно нажать кнопку «Сохранить» в пользовательском интерфейсе вручную, когда вы закончите диаграмму, в будущем будет поддерживаться автосохранение.kernel_computation=True, # set `kernel_computation=True`, pygwalker будет использовать DuckDB в качестве вычислительного механизма, он поможет вам исследовать больший набор данных (<= 100 ГБ).)
Код ноутбука: нажмите здесь.
Предварительный просмотр блокнота в формате HTML: нажмите здесь.
Используйте PyGWalker в Kaggle
Используйте PyGWalker в Google Colab
Streamlit позволяет вам разместить веб-версию pygwalker, не вдаваясь в подробности работы веб-приложения.
Вот некоторые примеры приложений, созданных с помощью pygwalker иstreamlit:
PyGWalker +streamlit для набора данных по совместному использованию велосипедов
Панель управления землетрясением
from pygwalker.api.streamlit import StreamlitRendererimport pandas as pdimportstreamlit as st# Отрегулируйте ширину страницы Streamlitst.set_page_config(page_title="Использовать Pygwalker в Streamlit",layout="wide")# Добавить Titlest.title("Использовать Pygwalker в Streamlit")# Вам следует кэшировать свой рендерер pygwalker, если вы не хотите, чтобы ваша память взорвать@st.cache_resourcedef get_pyg_renderer() -> "StreamlitRenderer":df = pd.read_csv("./bike_sharing_dc.csv")# Если вы хотите использовать функцию сохранения конфигурации диаграммы, установите `spec_io_mode="rw"`return StreamlitRenderer (df, spec="./gw_config.json", spec_io_mode="rw")renderer = get_pyg_renderer()renderer.explorer()
Параметр | Тип | По умолчанию | Описание |
---|---|---|---|
набор данных | Союз [DataFrame, соединитель] | - | Используемый кадр данных или соединитель. |
гид | Союз[интервал, ул] | Никто | Идентификатор div-контейнера GraphicWalker в формате «gwalker-{gid}». |
окружение | Литерал['Jupyter', 'JupyterWidget'] | «ЮпитерВиджет» | Среда с использованием pygwalker. |
field_specs | Необязательно[Dict[str, FieldSpec]] | Никто | Спецификация полей. Будет автоматически выведено из dataset , если не указано. |
скрыть_data_source_config | логическое значение | Истинный | Если True, кнопка импорта и экспорта DataSource скрывается. |
ключ_темы | Буквальный['вега', 'g2'] | 'g2' | Тип темы для GraphicWalker. |
появление | Буквальный ['медиа', 'светлый', 'темный'] | 'СМИ' | Настройка темы. «медиа» автоматически определит тему ОС. |
спецификация | ул. | "" | Данные конфигурации диаграммы. Может быть идентификатором конфигурации, JSON или URL-адресом удаленного файла. |
use_preview | логическое значение | Истинный | Если True, используется функция предварительного просмотра. |
kernel_computation | логическое значение | ЛОЖЬ | Если True, для данных используются вычисления ядра. |
**кварги | Любой | - | Дополнительные аргументы ключевого слова. |
Обратитесь к нему: местное развитие
Блокнот Юпитера
Гугл Колаб
Код Каггла
Юпитер Лаборатория
Юпитер Лайт
Блокнот Databricks (начиная с версии 0.1.4a0
)
Расширение Jupyter для кода Visual Studio (начиная с версии 0.1.4a0
)
Большинство веб-приложений совместимы с ядрами IPython. (Начиная с версии 0.1.4a0
)
Streamlit (начиная с версии 0.1.4.9
) , включенный с помощью pyg.walk(df, env='Streamlit')
Рабочая область DataCamp (начиная с версии 0.1.4a0
)
Панель. См. Panel-graphic-walker.
маримо (начиная с версии 0.4.9.11
)
Шестнадцатеричные проекты
...не стесняйтесь поднимать вопрос для большего количества сред.
Вы можете использовать pygwalker config
для настройки конфигурации конфиденциальности.
$ pygwalker конфиг --help использование: конфигурация pygwalker [-h] [--set [ключ=значение ...]] [--reset [ключ ...]] [--reset-all] [--list] Измените файл конфигурации. (по умолчанию: ~/Library/Application Support/pygwalker/config.json) Доступные конфигурации: - конфиденциальность ['оффлайн', 'только обновление', 'события'] (по умолчанию: события). «оффлайн»: полностью автономный режим, данные не отправляются и не запрашивается API «только обновление»: проверьте только, является ли это новая версия pygwalker для обновления «событий»: поделитесь, какие события и какая функция используются в pygwalker, она содержит только данные о событиях о том, какую функцию вы используете для оптимизации продукта. НЕТ ДАННЫХ, КОТОРЫЕ ВЫ АНАЛИЗИРУЕТЕ, ОТПРАВЛЯЮТСЯ. Данные о событиях будут привязаны к уникальному идентификатору, который генерируется pygwalker при его установке на основе отметки времени. Мы не будем собирать какую-либо другую информацию о вас. - kanaries_token ['ваш токен канарейки'] (по умолчанию: пустая строка). свой токен канарейки вы можете получить на https://kanaries.net. см.: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries. по токену kanaries вы можете использовать службу kanaries в pygwalker, например, общую диаграмму, общую конфигурацию. опции: -h, --help показать это справочное сообщение и выйти --set [ключ=значение ...] Установить конфигурацию. например, «pygwalker config --set Privacy=только для обновления» --reset [ключ ...] Сбросить конфигурацию пользователя и использовать вместо нее значения по умолчанию. например, «конфигурация pygwalker --reset конфиденциальность» --reset-all Сбросить всю пользовательскую конфигурацию и вместо этого использовать значения по умолчанию. например, «конфигурация pygwalker --reset-all» --list Вывести список текущей используемой конфигурации.
Более подробную информацию можно найти здесь: Как настроить конфигурацию конфиденциальности?
Лицензия Апач 2.0
PyGWalker Cloud выпущен! Теперь вы можете сохранять диаграммы в облаке, публиковать интерактивную ячейку как веб-приложение и использовать расширенные функции на базе GPT. Посетите PyGWalker Cloud для получения более подробной информации.
Ознакомьтесь с дополнительными ресурсами о PyGWalker на Kanaries PyGWalker
Документ о PyGWalker PyGWalker: оперативный помощник для исследовательского визуального анализа данных
Мы также работаем над RATH: программным обеспечением для автоматического исследовательского анализа данных с открытым исходным кодом, которое переопределяет рабочий процесс обработки, исследования и визуализации данных с помощью автоматизации на базе искусственного интеллекта. Посетите веб-сайт Kanaries и RATH GitHub, чтобы узнать больше!
Youtube: Как исследовать данные с помощью PyGWalker в Python
Используйте pygwalker для создания приложения визуального анализа в потоковом режиме
Используйте Panel-graphic-walker для создания приложений визуализации данных с помощью Panel.
Если у вас возникли какие-либо проблемы и вам нужна поддержка, присоединяйтесь к нашему каналу Discord или поднимите проблему на github.
Поделитесь pygwalker-ом в этих социальных сетях, если он вам нравится!