Englisch | Spanisch | Französisch | Deutsch | 中文 | Türkei | 日本語 | 한국어
PyGWalker kann Ihren Jupyter Notebook-Datenanalyse- und Datenvisualisierungs-Workflow vereinfachen, indem es Ihren Pandas-Datenrahmen in eine interaktive Benutzeroberfläche für die visuelle Erkundung verwandelt.
PyGWalker (ausgesprochen wie „Pig Walker“, nur zum Spaß) ist eine Abkürzung für „ Py thon binding of Graphic Walker “. Es integriert Jupyter Notebook mit Graphic Walker, einer Open-Source-Alternative zu Tableau. Es ermöglicht Datenwissenschaftlern, die Daten mit einfachen Drag-and-Drop-Vorgängen und sogar Abfragen in natürlicher Sprache zu visualisieren, zu bereinigen und mit Anmerkungen zu versehen.
Besuchen Sie die Online-Demo von Google Colab, Kaggle Code oder Graphic Walker, um es auszuprobieren!
Wenn Sie R bevorzugen, sehen Sie sich GWalkR an, den R-Wrapper von Graphic Walker.
Sehen Sie sich unser Video-Tutorial zur Verwendung von Pygwalker, Pygwalker + Streamlit und Pygwalker + Snowflake sowie zum Erkunden von Daten mit PyGWalker in Python an
Lauf in Kaggle | Führen Sie Colab aus |
---|---|
Stellen Sie vor der Verwendung von Pygwalker sicher, dass Sie die Pakete über die Befehlszeile mit pip oder conda installieren.
Pip Pygwalker installieren
Notiz
Für eine frühe Testversion können Sie die Installation mit
pip install pygwalker --upgrade
durchführen, um Ihre Version auf dem neuesten Stand zu halten, oder sogarpip install pygwalker --upgrade --pre
um die neuesten Funktionen und Fehlerbehebungen zu erhalten.
conda install -c conda-forge pygwalker
oder
mamba install -c conda-forge pygwalker
Weitere Hilfe finden Sie unter Conda-Forge-Rohstoff.
Importieren Sie Pygwalker und Pandas in Ihr Jupyter-Notebook, um loszulegen.
Importiere Pandas als Pdimportiere Pygwalker als Pyg
Sie können Pygwalker verwenden, ohne Ihren bestehenden Workflow zu unterbrechen. Sie können beispielsweise PyGWalker mit dem auf diese Weise geladenen Datenrahmen aufrufen:
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df)
Das ist es. Jetzt verfügen Sie über eine interaktive Benutzeroberfläche zum Analysieren und Visualisieren von Daten mit einfachen Drag-and-Drop-Vorgängen.
Coole Dinge, die Sie mit PyGwalker machen können:
Sie können den Markierungstyp in einen anderen ändern, um andere Diagramme zu erstellen, beispielsweise ein Liniendiagramm:
Um verschiedene Kennzahlen zu vergleichen, können Sie eine Concat-Ansicht erstellen, indem Sie mehr als eine Kennzahl in Zeilen/Spalten hinzufügen.
Um eine Facettenansicht mehrerer Unteransichten geteilt durch den Dimensionswert zu erstellen, fügen Sie Dimensionen in Zeilen oder Spalten ein, um eine Facettenansicht zu erstellen.
PyGWalker enthält eine leistungsstarke Datentabelle, die einen schnellen Überblick über Daten und deren Verteilung sowie Profilerstellung bietet. Sie können auch Filter hinzufügen oder die Datentypen in der Tabelle ändern.
Sie können das Ergebnis der Datenexploration in einer lokalen Datei speichern
Es gibt einige wichtige Parameter, die Sie bei der Verwendung von Pygwalker kennen sollten:
spec
: zum Speichern/Laden der Diagrammkonfiguration (JSON-Zeichenfolge oder Dateipfad)
kernel_computation
: Zur Verwendung von duckdb als Computer-Engine, die es Ihnen ermöglicht, größere Datensätze schneller auf Ihrem lokalen Computer zu verarbeiten.
use_kernel_calc
: Veraltet, verwenden Sie stattdessen kernel_computation
.
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df,spec="./chart_meta_0.json", # Diese JSON-Datei speichert Ihren Diagrammstatus. Sie müssen in der Benutzeroberfläche auf die Schaltfläche „Speichern“ klicken Jedes Mal, wenn Sie ein Diagramm fertigstellen, wird künftig „Autosave“ unterstützt.kernel_computation=True, # gesetzt „kernel_computation=True“, Pygwalker verwendet duckdb als Computer-Engine und unterstützt Sie bei der Erkundung größerer Datensätze (<= 100 GB).)
Notebook-Code: Klicken Sie hier
Vorschau des Notebook-HTML: Klicken Sie hier
Verwenden Sie PyGWalker in Kaggle
Verwenden Sie PyGWalker in Google Colab
Mit Streamlit können Sie eine Webversion von Pygwalker hosten, ohne sich mit der Funktionsweise der Webanwendung vertraut zu machen.
Hier sind einige der App-Beispiele, die mit Pygwalker und Streamlit erstellt wurden:
PyGWalker + Streamlit für Bike-Sharing-Datensatz
Erdbeben-Dashboard
from pygwalker.api.streamlit import StreamlitRendererimport pandas as pdimport streamlit as st# Passen Sie die Breite der Streamlit-Seite anst.set_page_config(page_title="Use Pygwalker In Streamlit",layout="wide")# Add Titlest.title("Use Pygwalker In Streamlit")# Sie sollten Ihren Pygwalker-Renderer zwischenspeichern, wenn Sie nicht möchten, dass Ihr Speicher dies tut [email protected]_resourcedef get_pyg_renderer() -> "StreamlitRenderer":df = pd.read_csv("./bike_sharing_dc.csv")# Wenn Sie die Funktion zum Speichern der Diagrammkonfiguration verwenden möchten, legen Sie „spec_io_mode="rw"`return StreamlitRenderer fest (df, spec="./gw_config.json", spec_io_mode="rw")renderer = get_pyg_renderer()renderer.explorer()
Parameter | Typ | Standard | Beschreibung |
---|---|---|---|
Datensatz | Union[DataFrame, Connector] | - | Der zu verwendende Datenrahmen oder Connector. |
gid | Union[int, str] | Keiner | ID für das GraphicWalker-Container-Div, formatiert als „gwalker-{gid}“. |
env | Literal['Jupyter', 'JupyterWidget'] | 'JupyterWidget' | Umgebung mit Pygwalker. |
field_specs | Optional[Dict[str, FieldSpec]] | Keiner | Spezifikationen der Felder. Wird automatisch aus dataset abgeleitet, wenn nicht angegeben. |
hide_data_source_config | bool | WAHR | Wenn True, wird die Schaltfläche zum Importieren und Exportieren von DataSource ausgeblendet. |
theme_key | Literal['vega', 'g2'] | 'g2' | Thementyp für den GraphicWalker. |
Aussehen | Literal['media', 'light', 'dark'] | 'Medien' | Themeneinstellung. „media“ erkennt das Betriebssystemthema automatisch. |
spez | str | „“ | Diagrammkonfigurationsdaten. Kann eine Konfigurations-ID, JSON oder eine Remote-Datei-URL sein. |
use_preview | bool | WAHR | Wenn True, wird die Vorschaufunktion verwendet. |
Kernelberechnung | bool | FALSCH | Wenn True, wird die Kernelberechnung für Daten verwendet. |
**Kwargs | Beliebig | - | Zusätzliche Schlüsselwortargumente. |
Verweisen Sie darauf: lokale Entwicklung
Jupyter-Notizbuch
Google Colab
Kaggle-Code
Jupyter-Labor
Jupyter Lite
Databricks Notebook (seit Version 0.1.4a0
)
Jupyter-Erweiterung für Visual Studio Code (seit Version 0.1.4a0
)
Die meisten Webanwendungen sind mit IPython-Kerneln kompatibel. (Seit Version 0.1.4a0
)
Streamlit (seit Version 0.1.4.9
) , aktiviert mit pyg.walk(df, env='Streamlit')
DataCamp Workspace (seit Version 0.1.4a0
)
Panel. Siehe Panel-Graphic-Walker.
Marimo (Seit Version 0.4.9.11
)
Hex-Projekte
...Sie können gerne ein Problem für weitere Umgebungen ansprechen.
Sie können pygwalker config
verwenden, um Ihre Datenschutzkonfiguration festzulegen.
$ pygwalker config --help Verwendung: pygwalker config [-h] [--set [Schlüssel=Wert ...]] [--reset [Schlüssel ...]] [--reset-all] [--list] Konfigurationsdatei ändern. (Standard: ~/Library/Application Support/pygwalker/config.json) Verfügbare Konfigurationen: - Datenschutz ['offline', 'nur Update', 'Ereignisse'] (Standard: Ereignisse). „Offline“: vollständig offline, es werden keine Daten gesendet oder API angefordert. „Nur Update“: nur prüfen, ob dies ein ist Neue Version von Pygwalker zum Aktualisieren von „Ereignissen“: Teilen Sie mit, welche Ereignisse über welche Funktion in Pygwalker verwendet werden. Es enthält nur Ereignisdaten darüber, welche Funktion Sie zur Produktoptimierung benötigen. Es werden keine von Ihnen analysierten Daten gesendet. Ereignisdaten werden mit einer eindeutigen ID verknüpft, die von Pygwalker bei der Installation basierend auf dem Zeitstempel generiert wird. Wir werden keine weiteren Informationen über Sie sammeln. - kanaries_token ['Ihr Kanaries-Token'] (Standard: leere Zeichenfolge). Ihren Kanaries-Token können Sie unter https://kanaries.net erhalten. siehe: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries. Mit dem Kanaries-Token können Sie den Kanaries-Dienst in Pygwalker verwenden, z. B. Share Chart, Share Config. Optionen: -h, --help zeigt diese Hilfemeldung an und beendet den Vorgang --set [Schlüssel=Wert ...] Konfiguration festlegen. zB „pygwalker config --set privatsphäre=update-only“ --reset [Schlüssel ...] Benutzerkonfiguration zurücksetzen und stattdessen Standardwerte verwenden. zB „pygwalker config --reset privatsphäre“ --reset-all Setzt die gesamte Benutzerkonfiguration zurück und verwendet stattdessen Standardwerte. zB „pygwalker config --reset-all“ --list Listet die aktuell verwendete Konfiguration auf.
Weitere Einzelheiten finden Sie hier: Wie stelle ich meine Datenschutzkonfiguration ein?
Apache-Lizenz 2.0
PyGWalker Cloud ist veröffentlicht! Sie können Ihre Diagramme jetzt in der Cloud speichern, die interaktive Zelle als Web-App veröffentlichen und erweiterte GPT-basierte Funktionen nutzen. Weitere Informationen finden Sie in der PyGWalker Cloud.
Weitere Ressourcen zu PyGWalker finden Sie auf Kanaries PyGWalker
PyGWalker Paper PyGWalker: On-the-fly-Assistent für explorative visuelle Datenanalyse
Wir arbeiten auch an RATH: einer Open-Source-Software zur explorativen Datenanalyse von Automate, die den Arbeitsablauf der Datenverarbeitung, -exploration und -visualisierung mit KI-gestützter Automatisierung neu definiert. Weitere Informationen finden Sie auf der Kanaries-Website und auf RATH GitHub!
Youtube: So erkunden Sie Daten mit PyGWalker in Python
Verwenden Sie Pygwalker, um eine visuelle Analyse-App in Streamlit zu erstellen
Verwenden Sie Panel-Graphic-Walker, um Datenvisualisierungs-Apps mit Panel zu erstellen.
Wenn Sie auf Probleme stoßen und Unterstützung benötigen, treten Sie bitte unserem Discord-Kanal bei oder melden Sie ein Problem auf Github.
Teilen Sie Pygwalker auf diesen Social-Media-Plattformen, wenn es Ihnen gefällt!