อังกฤษ | ภาษาสเปน | ฝรั่งเศส | เยอรมัน | 中文 | เตอร์กเช่ | ภาษาญี่ปุ่น | เกาหลี
PyGWalker สามารถทำให้การวิเคราะห์ข้อมูล Jupyter Notebook และเวิร์กโฟลว์การแสดงข้อมูลเป็นภาพง่ายขึ้น โดยการเปลี่ยน dataframe ของ pandas ให้เป็นอินเทอร์เฟซผู้ใช้เชิงโต้ตอบสำหรับการสำรวจด้วยภาพ
PyGWalker (ออกเสียงว่า "Pig Walker" เพื่อความสนุกสนาน) มีชื่อเป็นคำย่อของ " Py thon Binding of G raphic Walker " มันรวม Jupyter Notebook เข้ากับ Graphic Walker ซึ่งเป็นทางเลือกโอเพ่นซอร์สสำหรับ Tableau ช่วยให้นักวิทยาศาสตร์ข้อมูลเห็นภาพ / ล้าง / ใส่คำอธิบายประกอบข้อมูลด้วยการลากและวางที่เรียบง่าย และแม้แต่การสืบค้นด้วยภาษาธรรมชาติ
เยี่ยมชม Google Colab, Kaggle Code หรือ Graphic Walker Online Demo เพื่อทดสอบ!
หากคุณต้องการใช้ R ให้ตรวจสอบ GWalkR ซึ่งเป็น wrapper R ของ Graphic Walker
ตรวจสอบวิดีโอสอนของเราเกี่ยวกับการใช้ pygwalker, pygwalker + streamlit และ pygwalker + snowflake วิธีสำรวจข้อมูลด้วย PyGWalker ใน Python
วิ่งใน Kaggle | วิ่งใน Colab |
---|---|
ก่อนที่จะใช้ pygwalker ตรวจสอบให้แน่ใจว่าได้ติดตั้งแพ็คเกจผ่านบรรทัดคำสั่งโดยใช้ pip หรือ conda
pip ติดตั้ง pygwalker
บันทึก
สำหรับการทดลองใช้ช่วงต้น คุณสามารถติดตั้งด้วย
pip install pygwalker --upgrade
เพื่อให้เวอร์ชันของคุณทันสมัยอยู่เสมอ หรือแม้แต่pip install pygwalker --upgrade --pre
เพื่อรับคุณสมบัติล่าสุดและการแก้ไขข้อบกพร่อง
conda ติดตั้ง -c conda-forge pygwalker
หรือ
mamba ติดตั้ง -c conda-forge pygwalker
ดูวัตถุดิบตั้งต้นของ conda-forge สำหรับความช่วยเหลือเพิ่มเติม
นำเข้า pygwalker และ pandas ไปยัง Jupyter Notebook ของคุณเพื่อเริ่มต้น
นำเข้าแพนด้าเป็น pdimport pygwalker เป็น pyg
คุณสามารถใช้ pygwalker ได้โดยไม่ทำลายเวิร์กโฟลว์ที่มีอยู่ ตัวอย่างเช่น คุณสามารถเรียก PyGWalker โดยที่ dataframe โหลดในลักษณะนี้:
df = pd.read_csv('./bike_sharing_dc.csv')วอล์คเกอร์ = pyg.walk(df)
แค่นั้นแหละ. ขณะนี้คุณมี UI แบบโต้ตอบเพื่อวิเคราะห์และแสดงภาพข้อมูลด้วยการลากและวางที่ง่ายดาย
สิ่งดีๆ ที่คุณสามารถทำได้ด้วย PyGwalker:
คุณสามารถเปลี่ยนประเภทเครื่องหมายเป็นประเภทอื่นเพื่อสร้างแผนภูมิที่แตกต่างกันได้ เช่น แผนภูมิเส้น:
หากต้องการเปรียบเทียบการวัดที่แตกต่างกัน คุณสามารถสร้างมุมมองที่เชื่อมต่อกันได้โดยการเพิ่มการวัดมากกว่าหนึ่งรายการลงในแถว/คอลัมน์
หากต้องการสร้างมุมมองด้านของการดูย่อยหลายรายการหารด้วยค่าในมิติ ให้ใส่มิติข้อมูลลงในแถวหรือคอลัมน์เพื่อสร้างมุมมองด้าน
PyGWalker มีตารางข้อมูลที่มีประสิทธิภาพ ซึ่งให้มุมมองที่รวดเร็วของข้อมูล ตลอดจนการกระจาย และการทำโปรไฟล์ คุณยังเพิ่มตัวกรองหรือเปลี่ยนประเภทข้อมูลในตารางได้ด้วย
คุณสามารถบันทึกผลการสำรวจข้อมูลลงในไฟล์ในเครื่องได้
มีพารามิเตอร์สำคัญบางประการที่คุณควรรู้เมื่อใช้ pygwalker:
spec
: สำหรับบันทึก/โหลดแผนภูมิการกำหนดค่า (สตริง json หรือเส้นทางไฟล์)
kernel_computation
: สำหรับการใช้ duckdb เป็นเครื่องมือคำนวณซึ่งช่วยให้คุณจัดการชุดข้อมูลขนาดใหญ่ได้เร็วขึ้นในเครื่องท้องถิ่นของคุณ
use_kernel_calc
: เลิกใช้แล้ว ให้ใช้ kernel_computation
แทน
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df,spec="./chart_meta_0.json", # ไฟล์ json นี้จะบันทึกสถานะแผนภูมิของคุณ คุณต้องคลิกปุ่มบันทึกใน ui ด้วยตนเองเมื่อคุณเสร็จสิ้นแผนภูมิ 'บันทึกอัตโนมัติ' จะได้รับการสนับสนุนในอนาคต.kernel_computation=True, # set `kernel_computation=True`, pygwalker จะใช้ duckdb เป็นเครื่องมือคำนวณ ซึ่งสนับสนุนให้คุณสำรวจชุดข้อมูลที่ใหญ่กว่า (<=100GB))
รหัสโน๊ตบุ๊ค: คลิกที่นี่
ดูตัวอย่าง Notebook Html: คลิกที่นี่
ใช้ PyGWalker ใน Kaggle
ใช้ PyGWalker ใน Google Colab
Streamlit ช่วยให้คุณสามารถโฮสต์ pygwalker เวอร์ชันเว็บได้โดยไม่ต้องทราบรายละเอียดว่าเว็บแอปพลิเคชันทำงานอย่างไร
นี่คือตัวอย่างแอปบางส่วนที่สร้างด้วย pygwalker และ streamlit:
PyGWalker + streamlit สำหรับชุดข้อมูลการแชร์ Bike
แดชบอร์ดแผ่นดินไหว
จาก pygwalker.api.streamlit import StreamlitRendererimport pandas as pdimport streamlit as st# ปรับความกว้างของหน้า Streamlitt.set_page_config(page_title="Use Pygwalker In Streamlit",layout="wide")# Add Titlest.title("Use Pygwalker In Streamlit")# คุณควรแคชตัวเรนเดอร์ pygwalker ของคุณ หากคุณไม่ต้องการให้มีหน่วยความจำของคุณ [email protected]_resourcedef get_pyg_renderer() -> "StreamlitRenderer":df = pd.read_csv("./bike_sharing_dc.csv")# หากคุณต้องการใช้คุณลักษณะของการบันทึกการกำหนดค่าแผนภูมิ ให้ตั้งค่า `spec_io_mode="rw"`return StreamlitRenderer (df, spec="./gw_config.json", spec_io_mode="rw")renderer = get_pyg_renderer()renderer.explorer()
พารามิเตอร์ | พิมพ์ | ค่าเริ่มต้น | คำอธิบาย |
---|---|---|---|
ชุดข้อมูล | ยูเนี่ยน [DataFrame, ตัวเชื่อมต่อ] | - | dataframe หรือตัวเชื่อมต่อที่จะใช้ |
กิ๊ด | ยูเนี่ยน[int, str] | ไม่มี | รหัสสำหรับ div คอนเทนเนอร์ GraphicWalker ซึ่งจัดรูปแบบเป็น 'gwalker-{gid}' |
สิ่งแวดล้อม | ตัวอักษร ['Jupyter', 'JupyterWidget'] | 'JupyterWidget' | สภาพแวดล้อมโดยใช้ pygwalker |
field_specs | ทางเลือก[Dict[str, FieldSpec]] | ไม่มี | ข้อมูลจำเพาะของฟิลด์ จะถูกอนุมานจาก dataset โดยอัตโนมัติหากไม่ได้ระบุ |
ซ่อน_data_source_config | บูล | จริง | ถ้าเป็นจริง จะซ่อนปุ่มนำเข้าและส่งออกแหล่งข้อมูล |
theme_key | ตัวอักษร['vega', 'g2'] | 'g2' | ประเภทธีมสำหรับ GraphicWalker |
รูปร่าง | ตัวอักษร ['สื่อ', 'แสง', 'ความมืด'] | 'สื่อ' | การตั้งค่าธีม 'สื่อ' จะตรวจจับธีมระบบปฏิบัติการโดยอัตโนมัติ |
ข้อมูลจำเพาะ | STR | - | ข้อมูลการกำหนดค่าแผนภูมิ อาจเป็นรหัสการกำหนดค่า, JSON หรือ URL ของไฟล์ระยะไกล |
use_preview | บูล | จริง | หากเป็น True ให้ใช้ฟังก์ชันแสดงตัวอย่าง |
kernel_computation | บูล | เท็จ | หากเป็น True จะใช้การคำนวณเคอร์เนลสำหรับข้อมูล |
**กวาร์ก | ใดๆ | - | อาร์กิวเมนต์คำหลักเพิ่มเติม |
อ้างถึง: การพัฒนาท้องถิ่น
สมุดบันทึกจูปีเตอร์
Google Colab
รหัส Kaggle
จูปีเตอร์ แล็บ
จูปีเตอร์ ไลท์
Databricks Notebook (ตั้งแต่เวอร์ชัน 0.1.4a0
)
Jupyter Extension สำหรับ Visual Studio Code (ตั้งแต่เวอร์ชัน 0.1.4a0
)
เว็บแอปพลิเคชันส่วนใหญ่เข้ากันได้กับเคอร์เนล IPython (ตั้งแต่เวอร์ชัน 0.1.4a0
)
Streamlit (ตั้งแต่เวอร์ชัน 0.1.4.9
) เปิดใช้งานด้วย pyg.walk(df, env='Streamlit')
DataCamp Workspace (ตั้งแต่เวอร์ชัน 0.1.4a0
)
แผง. ดูแผงกราฟิกวอล์คเกอร์
marimo (ตั้งแต่เวอร์ชัน 0.4.9.11
)
โครงการฐานสิบหก
...อย่าลังเลที่จะแจ้งปัญหาสำหรับสภาพแวดล้อมเพิ่มเติม
คุณสามารถใช้ pygwalker config
เพื่อตั้งค่าความเป็นส่วนตัวของคุณได้
$ pygwalker config --help การใช้งาน: pygwalker config [-h] [--set [key=value ...]] [--reset [key ...]] [--reset-all] [--list] แก้ไขไฟล์การกำหนดค่า (ค่าเริ่มต้น: ~/Library/Application Support/pygwalker/config.json) การกำหนดค่าที่ใช้ได้: - ความเป็นส่วนตัว ['ออฟไลน์', 'อัปเดตเท่านั้น', 'กิจกรรม'] (ค่าเริ่มต้น: กิจกรรม) "ออฟไลน์": ออฟไลน์โดยสมบูรณ์ ไม่มีการส่งข้อมูลหรือร้องขอ API "อัปเดตเท่านั้น": ตรวจสอบเท่านั้นว่าเป็น pygwalker เวอร์ชันใหม่ที่จะอัปเดต "เหตุการณ์": แบ่งปันกิจกรรมเกี่ยวกับคุณลักษณะที่ใช้ใน pygwalker โดยจะมีเฉพาะข้อมูลเหตุการณ์เกี่ยวกับคุณลักษณะที่คุณมาถึงเพื่อเพิ่มประสิทธิภาพผลิตภัณฑ์ ไม่มีข้อมูลที่คุณวิเคราะห์ถูกส่งไป ข้อมูลเหตุการณ์จะผูกเข้ากับรหัสเฉพาะซึ่งสร้างโดย pygwalker เมื่อติดตั้งตามการประทับเวลา เราจะไม่รวบรวมข้อมูลอื่นใดเกี่ยวกับคุณ - kanaries_token ['โทเค็น kanaries ของคุณ'] (ค่าเริ่มต้น: สตริงว่าง) โทเค็นคานารีของคุณ คุณสามารถรับได้จาก https://kanaries.net อ้างอิง: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries ด้วยโทเค็น kanaries คุณสามารถใช้บริการ kanaries ใน pygwalker ได้ เช่น แผนภูมิการแชร์ การตั้งค่าการแชร์ ตัวเลือก: -h, --help แสดงข้อความช่วยเหลือนี้และออก --set [คีย์=ค่า ...] ตั้งค่าคอนฟิก เช่น "pygwalker config --set Privacy=update-only" --รีเซ็ต [คีย์ ...] รีเซ็ตการกำหนดค่าผู้ใช้และใช้ค่าเริ่มต้นแทน เช่น "pygwalker config --reset ความเป็นส่วนตัว" --reset-all รีเซ็ตการกำหนดค่าผู้ใช้ทั้งหมดและใช้ค่าเริ่มต้นแทน เช่น "pygwalker config --reset-all" --list แสดงรายการการกำหนดค่าที่ใช้ในปัจจุบัน
รายละเอียดเพิ่มเติม โปรดดูที่: วิธีการตั้งค่าการกำหนดค่าความเป็นส่วนตัวของคุณ?
ใบอนุญาต Apache 2.0
PyGWalker Cloud เปิดตัวแล้ว! ตอนนี้คุณสามารถบันทึกแผนภูมิของคุณบนคลาวด์ เผยแพร่เซลล์เชิงโต้ตอบเป็นเว็บแอป และใช้คุณสมบัติขั้นสูงที่ขับเคลื่อนโดย GPT ตรวจสอบ PyGWalker Cloud สำหรับรายละเอียดเพิ่มเติม
ตรวจสอบแหล่งข้อมูลเพิ่มเติมเกี่ยวกับ PyGWalker บน Kanaries PyGWalker
PyGWalker Paper PyGWalker: ผู้ช่วยที่รวดเร็วสำหรับการวิเคราะห์ข้อมูลภาพเชิงสำรวจ
นอกจากนี้ เรากำลังพัฒนา RATH: ซอฟต์แวร์วิเคราะห์ข้อมูลเชิงสำรวจแบบโอเพ่นซอร์สอัตโนมัติ ซึ่งกำหนดนิยามใหม่ให้กับเวิร์กโฟลว์ของการถกเถียงข้อมูล การสำรวจ และการแสดงภาพด้วยระบบอัตโนมัติที่ขับเคลื่อนด้วย AI ตรวจสอบเว็บไซต์ Kanaries และ RATH GitHub เพื่อดูข้อมูลเพิ่มเติม!
Youtube: วิธีสำรวจข้อมูลด้วย PyGWalker ใน Python
ใช้ pygwalker เพื่อสร้างแอปวิเคราะห์ภาพใน streamlit
ใช้ panel-graphic-walker เพื่อสร้างแอปแสดงข้อมูลด้วย Panel
หากคุณพบปัญหาใดๆ และต้องการความช่วยเหลือ โปรดเข้าร่วมช่องทาง Discord ของเราหรือแจ้งปัญหาบน GitHub
แบ่งปัน pygwalker บนแพลตฟอร์มโซเชียลมีเดียเหล่านี้หากคุณต้องการ!