Bahasa Inggris | Spanyol | Perancis | Jerman | 中文 | Turki | 日本語 | 한국어
PyGWalker dapat menyederhanakan analisis data Jupyter Notebook dan alur kerja visualisasi data, dengan mengubah kerangka data pandas Anda menjadi antarmuka pengguna interaktif untuk eksplorasi visual.
PyGWalker (diucapkan seperti "Pig Walker", hanya untuk bersenang-senang) dinamai sebagai singkatan dari " Py thon binding of G raphic Walker ". Ini mengintegrasikan Jupyter Notebook dengan Graphic Walker, sebuah alternatif sumber terbuka untuk Tableau. Hal ini memungkinkan ilmuwan data untuk memvisualisasikan/membersihkan/memberi anotasi data dengan operasi drag-and-drop sederhana dan bahkan kueri bahasa alami.
Kunjungi Google Colab, Kaggle Code, atau Demo Online Graphic Walker untuk mengujinya!
Jika Anda lebih suka menggunakan R, periksa GWalkR, pembungkus R dari Graphic Walker.
Lihat tutorial video kami tentang menggunakan pygwalker, pygwalker + streamlit dan pygwalker + kepingan salju, Cara menjelajahi data dengan PyGWalker dengan Python
Jalankan di Kaggle | Jalankan di Colab |
---|---|
Sebelum menggunakan pygwalker, pastikan untuk menginstal paket melalui baris perintah menggunakan pip atau conda.
pip instal pygwalker
Catatan
Untuk uji coba awal, Anda dapat menginstal dengan
pip install pygwalker --upgrade
agar versi Anda selalu terbarui dengan rilis terbaru atau bahkanpip install pygwalker --upgrade --pre
untuk mendapatkan fitur terbaru dan perbaikan bug.
conda install -c conda-forge pygwalker
atau
instalasi mamba -c conda-forge pygwalker
Lihat bahan baku conda-forge untuk bantuan lebih lanjut.
Impor pygwalker dan panda ke Notebook Jupyter Anda untuk memulai.
impor panda sebagai pdimport pygwalker sebagai pyg
Anda dapat menggunakan pygwalker tanpa mengganggu alur kerja yang ada. Misalnya, Anda dapat memanggil PyGWalker dengan kerangka data yang dimuat dengan cara ini:
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df)
Itu saja. Sekarang Anda memiliki UI interaktif untuk menganalisis dan memvisualisasikan data dengan operasi drag-and-drop sederhana.
Hal keren yang dapat Anda lakukan dengan PyGwalker:
Anda dapat mengubah jenis tanda menjadi jenis tanda lain untuk membuat bagan yang berbeda, misalnya bagan garis:
Untuk membandingkan ukuran yang berbeda, Anda dapat membuat tampilan gabungan dengan menambahkan lebih dari satu ukuran ke dalam baris/kolom.
Untuk membuat tampilan segi dari beberapa subtampilan dibagi dengan nilai dimensi, masukkan dimensi ke dalam baris atau kolom untuk membuat tampilan segi.
PyGWalker berisi tabel data yang kuat, yang menyediakan tampilan cepat data dan distribusinya, pembuatan profil. Anda juga dapat menambahkan filter atau mengubah tipe data dalam tabel.
Anda dapat menyimpan hasil eksplorasi data ke file lokal
Ada beberapa parameter penting yang harus Anda ketahui saat menggunakan pygwalker:
spec
: untuk menyimpan/memuat konfigurasi grafik (string json atau jalur file)
kernel_computation
: untuk menggunakan duckdb sebagai mesin komputasi yang memungkinkan Anda menangani kumpulan data yang lebih besar dengan lebih cepat di mesin lokal Anda.
use_kernel_calc
: Tidak digunakan lagi, gunakan kernel_computation
sebagai gantinya.
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df,spec="./chart_meta_0.json", # file json ini akan menyimpan status grafik Anda, Anda perlu mengklik tombol simpan di ui manual ketika Anda menyelesaikan grafik, 'penyimpanan otomatis' akan didukung di masa depan.kernel_computation=True, # set `kernel_computation=True`, pygwalker akan menggunakan duckdb sebagai mesin komputasi, ini mendukung Anda menjelajahi kumpulan data yang lebih besar (<=100GB).)
Kode Buku Catatan: Klik Disini
Pratinjau Notebook Html: Klik Disini
Gunakan PyGWalker di Kaggle
Gunakan PyGWalker di Google Colab
Streamlit memungkinkan Anda menghosting pygwalker versi web tanpa mengetahui detail cara kerja aplikasi web.
Berikut beberapa contoh aplikasi yang dibuat dengan pygwalker dan streamlit:
PyGWalker + streamlit untuk kumpulan data berbagi Sepeda
Dasbor Gempa
from pygwalker.api.streamlit import StreamlitRendererimport pandas as pdimport streamlit as st# Sesuaikan lebar halaman Streamlit.set_page_config(page_title="Gunakan Pygwalker In Streamlit",layout="wide")# Tambahkan Titlest.title("Gunakan Pygwalker In Streamlit")# Anda harus menyimpan penyaji pygwalker Anda dalam cache, jika Anda tidak ingin memori Anda menyimpannya [email protected]_resourcedef get_pyg_renderer() -> "StreamlitRenderer":df = pd.read_csv("./bike_sharing_dc.csv")# Jika Anda ingin menggunakan fitur menyimpan konfigurasi grafik, setel `spec_io_mode="rw"`return StreamlitRenderer (df, spec="./gw_config.json", spec_io_mode="rw") perender = get_pyg_renderer()renderer.explorer()
Parameter | Jenis | Bawaan | Keterangan |
---|---|---|---|
kumpulan data | Persatuan[Bingkai Data, Konektor] | - | Kerangka data atau konektor yang akan digunakan. |
gid | Persatuan[int, str] | Tidak ada | ID untuk div container GraphicWalker, diformat sebagai 'gwalker-{gid}'. |
env | Harafiah['Jupyter', 'JupyterWidget'] | 'JupyterWidget' | Lingkungan menggunakan pygwalker. |
bidang_spesifikasi | Opsional[Dict[str, FieldSpec]] | Tidak ada | Spesifikasi bidang. Akan secara otomatis disimpulkan dari dataset jika tidak ditentukan. |
sembunyikan_data_source_config | bodoh | BENAR | Jika Benar, sembunyikan tombol impor dan ekspor DataSource. |
tema_kunci | Harafiah['vega', 'g2'] | 'g2' | Jenis tema untuk GraphicWalker. |
penampilan | Harafiah['media', 'terang', 'gelap'] | 'media' | Pengaturan tema. 'media' akan mendeteksi tema OS secara otomatis. |
spesifikasi | str | "" | Data konfigurasi bagan. Dapat berupa ID konfigurasi, JSON, atau URL file jarak jauh. |
gunakan_pratinjau | bodoh | BENAR | Jika Benar, gunakan fungsi pratinjau. |
kernel_computation | bodoh | PALSU | Jika Benar, gunakan komputasi kernel untuk data. |
**kwarg | Setiap | - | Argumen kata kunci tambahan. |
Lihat: pembangunan lokal
Buku Catatan Jupyter
Google Kolab
Kode Kaggle
Lab Jupyter
Jupyter Lite
Notebook Databricks (Sejak versi 0.1.4a0
)
Ekstensi Jupyter untuk Visual Studio Code (Sejak versi 0.1.4a0
)
Sebagian besar aplikasi web kompatibel dengan kernel IPython. (Sejak versi 0.1.4a0
)
Streamlit (Sejak versi 0.1.4.9
) , diaktifkan dengan pyg.walk(df, env='Streamlit')
Ruang Kerja DataCamp (Sejak versi 0.1.4a0
)
Panel. Lihat panel-grafik-walker.
marimo (Sejak versi 0.4.9.11
)
Proyek Hex
...jangan ragu untuk mengangkat masalah ke lebih banyak lingkungan.
Anda dapat menggunakan pygwalker config
untuk mengatur konfigurasi privasi Anda.
$ konfigurasi pygwalker --membantu penggunaan: konfigurasi pygwalker [-h] [--set [kunci=nilai ...]] [--reset [kunci ...]] [--reset-semua] [--list] Ubah file konfigurasi. (default: ~/Library/Dukungan Aplikasi/pygwalker/config.json) Konfigurasi yang tersedia: - privasi ['offline', 'update-only', 'events'] (default: events)."offline": sepenuhnya offline, tidak ada data yang dikirim atau api diminta"update-only": hanya periksa apakah ini adalah versi baru pygwalker untuk memperbarui"acara": membagikan peristiwa tentang fitur mana yang digunakan di pygwalker, ini hanya berisi data peristiwa tentang fitur mana yang Anda datangi untuk pengoptimalan produk. TIDAK ADA DATA YANG ANDA ANALISIS KIRIM. Data peristiwa akan diikat dengan id unik, yang dihasilkan oleh pygwalker saat dipasang berdasarkan stempel waktu. Kami tidak akan mengumpulkan informasi lain tentang Anda. - kanaries_token ['token kanaries Anda'] (default: string kosong). token kanaries Anda, Anda bisa mendapatkannya dari https://kanaries.net. lihat: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries. dengan token kanaries, Anda dapat menggunakan layanan kanaries di pygwalker, seperti share chart, share config. pilihan: -h, --help tampilkan pesan bantuan ini dan keluar --set [kunci=nilai ...] Atur konfigurasi. misalnya "konfigurasi pygwalker --set privasi=hanya pembaruan" --reset [key ...] Reset konfigurasi pengguna dan gunakan nilai default. misalnya "konfigurasi pygwalker --reset privasi" --reset-all Reset semua konfigurasi pengguna dan gunakan nilai default sebagai gantinya. misalnya "konfigurasi pygwalker --reset-all" --list Daftar konfigurasi yang digunakan saat ini.
Lebih jelasnya, lihat: Bagaimana cara mengatur konfigurasi privasi Anda?
Lisensi Apache 2.0
PyGWalker Cloud telah dirilis! Anda sekarang dapat menyimpan grafik Anda ke cloud, mempublikasikan sel interaktif sebagai aplikasi web dan menggunakan fitur-fitur canggih yang didukung GPT. Lihat PyGWalker Cloud untuk lebih jelasnya.
Lihat sumber daya lainnya tentang PyGWalker di Kanaries PyGWalker
Makalah PyGWalker PyGWalker: Asisten Langsung untuk Analisis Data Visual Eksplorasi
Kami juga sedang mengerjakan RATH: perangkat lunak analisis data eksplorasi Open Source dan Otomatisasi yang mendefinisikan ulang alur kerja perselisihan, eksplorasi, dan visualisasi data dengan otomatisasi yang didukung AI. Kunjungi situs web Kanaries dan RATH GitHub untuk informasi lebih lanjut!
Youtube: Cara menjelajahi data dengan PyGWalker dengan Python
Gunakan pygwalker untuk membuat aplikasi analisis visual secara streamlit
Gunakan panel-graphic-walker untuk membuat aplikasi visualisasi data dengan Panel.
Jika Anda mengalami masalah apa pun dan memerlukan dukungan, silakan bergabung dengan saluran Discord kami atau ajukan masalah di github.
Bagikan pygwalker di platform media sosial ini jika Anda menyukainya!