英語 |西班牙語 |法語 |德語 | 中文 |土耳其 | 日本語 | 한국어
PyGWalker可以透過將 pandas 資料框轉變為用於視覺探索的互動式使用者介面來簡化 Jupyter Notebook 資料分析和資料視覺化工作流程。
PyGWalker (發音像“Pig Walker”,只是為了好玩)被命名為“ Py thon binding of Graphic Walker ”的縮寫。它將 Jupyter Notebook 與 Graphic Walker(Tableau 的開源替代方案)整合。它允許資料科學家透過簡單的拖放操作甚至自然語言查詢來視覺化/清理/註釋資料。
造訪 Google Colab、Kaggle Code 或 Graphic Walker Online Demo 進行測試!
如果您喜歡使用 R,請查看 GWalkR,Graphic Walker 的 R 包裝器。
查看有關使用 pygwalker、pygwalker + Streamlit 和 pygwalker + Snowflake 的影片教學課程,如何在 Python 中使用 PyGWalker 探索數據
在 Kaggle 中運行 | 在 Colab 中運行 |
---|---|
在使用 pygwalker 之前,請確保使用 pip 或 conda 透過命令列安裝軟體包。
pip 安裝 pygwalker
筆記
對於早期試用,您可以使用
pip install pygwalker --upgrade
進行安裝,以使您的版本與最新版本保持同步,甚至可以pip install pygwalker --upgrade --pre
來獲取最新功能和錯誤修復。
conda 安裝-c conda-forge pygwalker
或者
曼巴安裝-c conda-forge pygwalker
請參閱 conda-forge feedstock 以取得更多協助。
將 pygwalker 和 pandas 匯入您的 Jupyter Notebook 即可開始使用。
將 pandas 導入為 pd 將 pygwalker 導入為 pyg
您可以在不破壞現有工作流程的情況下使用 pygwalker。例如,您可以透過以下方式載入資料幀來呼叫 PyGWalker:
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df)
就是這樣。現在,您擁有一個互動式 UI,可以透過簡單的拖放操作來分析和視覺化資料。
使用 PyGwalker 可以做很酷的事:
您可以將標記類型變更為其他類型以製作不同的圖表,例如折線圖:
若要比較不同的度量,您可以透過將多個度量新增至行/列來建立連續視圖。
若要製作多個子視圖除以維度中的值的分面視圖,請將維度放入行或列中以製作分面視圖。
PyGWalker 包含一個強大的資料表,它提供了資料及其分佈、分析的快速視圖。您也可以新增篩選器或變更表中的資料類型。
您可以將資料探索結果儲存到本機文件
使用 pygwalker 時您應該了解一些重要參數:
spec
:用於儲存/載入圖表配置(json 字串或檔案路徑)
kernel_computation
:使用 duckdb 作為計算引擎,它允許您在本機電腦中更快地處理更大的資料集。
use_kernel_calc
:已棄用,請使用kernel_computation
代替。
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df,spec="./chart_meta_0.json", # 這個json檔案將保存你的圖表狀態,你需要點擊ui中的儲存按鈕手動完成圖表後,將來將支援「自動儲存」。
筆記本程式碼:點這裡
預覽筆記本 Html:按一下此處
在 Kaggle 中使用 PyGWalker
在 Google Colab 使用 PyGWalker
Streamlit 可讓您託管 pygwalker 的 Web 版本,而無需了解 Web 應用程式如何運作的詳細資訊。
以下是一些使用 pygwalker 和 Streamlit 建立的應用程式範例:
PyGWalker + Streamlit 用於自行車共享資料集
地震儀表板
from pygwalker.api.streamlit import StreamlitRendererimport pandas as pdimport Streamlit as st# 調整Streamlit page的寬度st.set_page_config(page_title="在Streamlit中使用Pygwalker",layout="wide")# 添加TitlestStream.Streamtitle("在lityglit.使用Pygwalker Streamlit")# 如果你不想讓記憶體爆炸,你應該快取你的 pygwalker 渲染器@st.cache_resourcedef get_pyg_renderer() -> "StreamlitRenderer":df = pd.read_csv("./bike_sharing_dc.csv")# If.如果您想要使用儲存圖表配置的功能,請設定`spec_io_mode="rw"`return StreamlitRenderer(df, spec="./gw_config.json", spec_io_mode="rw")renderer = get_pyg_renderer()renderer.explorer()
範圍 | 類型 | 預設 | 描述 |
---|---|---|---|
數據集 | 聯合[資料框、連接器] | - | 要使用的資料框或連接器。 |
吉德 | 聯合[int, str] | 沒有任何 | GraphicWalker 容器 div 的 ID,格式為「gwalker-{gid}」。 |
環境 | 文字['Jupyter', 'JupyterWidget'] | 'JupyterWidget' | 使用pygwalker的環境。 |
字段規格 | 可選[Dict[str, FieldSpec]] | 沒有任何 | 字段規範。如果未指定,將從dataset 集中自動推斷。 |
隱藏資料來源配置 | 布林值 | 真的 | 如果為 True,則隱藏資料來源匯入和匯出按鈕。 |
主題鍵 | 文字['vega', 'g2'] | 'g2' | GraphicWalker 的主題類型。 |
外貌 | 文字['媒體'、'淺色'、'深色'] | '媒體' | 主題設定。 「媒體」將自動偵測作業系統主題。 |
規格 | 斯特 | ”” | 圖表配置數據。可以是設定 ID、JSON 或遠端檔案 URL。 |
使用預覽 | 布林值 | 真的 | 如果為 True,則使用預覽功能。 |
核心計算 | 布林值 | 錯誤的 | 如果為 True,則對資料使用內核計算。 |
**誇格 | 任何 | - | 附加關鍵字參數。 |
參考:本地開發
Jupyter筆記本
Google合作實驗室
卡格爾代碼
Jupyter實驗室
Jupyter Lite
Databricks Notebook(自版0.1.4a0
起)
Visual Studio Code 的 Jupyter 擴充功能(自版本0.1.4a0
起)
大多數 Web 應用程式與 IPython 核心相容。 (自版本0.1.4a0
起)
Streamlit(自版本0.1.4.9
起) ,透過pyg.walk(df, env='Streamlit')
啟用
DataCamp 工作區(自版本0.1.4a0
起)
控制板。請參閱面板圖形步行器。
marimo(自版本0.4.9.11
起)
十六進位項目
....隨意提出更多環境的問題。
您可以使用pygwalker config
來設定您的隱私配置。
$ pygwalker配置--幫助 用法: pygwalker config [-h] [--set [key=value ...]] [--reset [key ...]] [--reset-all] [--list] 修改設定檔。 (預設:~/Library/Application Support/pygwalker/config.json) 可用配置: - 隱私 ['offline', 'update-only', 'events'] (預設: events)。的pygwalker更新「事件」:分享有關pygwalker中使用哪個功能的事件,它僅包含有關您到達哪個功能以進行產品最佳化的事件資料。沒有發送您分析的數據。事件資料將與唯一的 id 綁定,該 id 是由 pygwalker 在安裝時根據時間戳生成的。我們不會收集任何其他有關您的資訊。 - kanaries_token ['你的 kanaries 令牌'] (預設值:空字串)。 您的 kanaries 令牌,您可以從 https://kanaries.net 取得。 請參閱:https://space.kanaries.net/t/how-to-get-api-key-of-kanaries。 透過 kanaries 令牌,您可以在 pygwalker 中使用 kanaries 服務,例如共享圖表、共享配置。 選項:-h、--help 顯示此說明訊息並退出 --set [鍵=值...] 設定配置。例如“pygwalker配置--設定隱私=僅更新” --reset [key ...] 重設使用者配置並使用預設值。例如“pygwalker配置--重置隱私” --reset-all 重置所有使用者配置並使用預設值。例如“pygwalker config --reset-all” --list 列出目前使用的配置。
更多詳情,請參考:如何設定您的隱私配置?
阿帕契許可證 2.0
PyGWalker 雲端發佈!現在您可以將圖表儲存到雲端、將互動式單元發佈為 Web 應用程式並使用由 GPT 提供支援的進階功能。查看 PyGWalker Cloud 以了解更多詳細資訊。
在 Kanaries PyGWalker 上查看有關 PyGWalker 的更多資源
PyGWalker 論文 PyGWalker:探索性視覺化資料分析的即時助手
我們也正在開發 RATH:一款開源、自動化的探索性資料分析軟體,它透過人工智慧驅動的自動化重新定義了資料整理、探索和視覺化的工作流程。查看 Kanaries 網站和 RATH GitHub 以了解更多資訊!
Youtube:如何在 Python 中使用 PyGWalker 探索數據
使用pygwalker在streamlit中建立視覺化分析應用程式
使用 panel-graphic-walker 透過 Panel 建立數據視覺化應用程式。
如果您遇到任何問題並需要支持,請加入我們的 Discord 頻道或在 github 上提出問題。
如果你喜歡,請在這些社群媒體平台上分享 pygwalker!