영어 | 스페인어 | 프랑세즈 | 독일어 | 중국어 | 터키어 | 일본어 | 한국어
PyGWalker는 Pandas 데이터프레임을 시각적 탐색을 위한 대화형 사용자 인터페이스로 전환하여 Jupyter Notebook 데이터 분석 및 데이터 시각화 워크플로를 단순화할 수 있습니다.
PyGWalker (재미있게 "Pig Walker"처럼 발음)는 " Py thon Binding of G Raphic Walker "의 약자로 명명되었습니다. Tableau의 오픈 소스 대안인 Graphic Walker와 Jupyter Notebook을 통합합니다. 이를 통해 데이터 과학자는 간단한 드래그 앤 드롭 작업과 자연어 쿼리를 통해 데이터를 시각화/정리/주석을 달 수 있습니다.
Google Colab, Kaggle Code 또는 Graphic Walker 온라인 데모를 방문하여 테스트해보세요!
R 사용을 선호한다면 Graphic Walker의 R 래퍼인 GWalkR을 확인하세요.
pygwalker, pygwalker + streamlit 및 pygwalker + Snowflake 사용에 대한 비디오 튜토리얼, Python에서 PyGWalker로 데이터를 탐색하는 방법을 확인하세요.
캐글에서 실행 | Colab에서 실행 |
---|---|
pygwalker를 사용하기 전에 pip 또는 conda를 사용하여 명령줄을 통해 패키지를 설치해야 합니다.
핍 설치 피그워커
메모
초기 평가판의 경우
pip install pygwalker --upgrade
사용하여 설치하여 최신 릴리스로 최신 버전을 유지하거나pip install pygwalker --upgrade --pre
사용하여 최신 기능과 버그 수정을 얻을 수도 있습니다.
conda 설치 -c conda-forge pygwalker
또는
맘바 설치 -c conda-forge pygwalker
자세한 내용은 conda-forge 공급원료를 참조하세요.
시작하려면 pygwalker 및 pandas를 Jupyter Notebook으로 가져오세요.
Pandas를 pdimport로 가져오기 pygwalker를 pyg로 가져오기
기존 워크플로우를 중단하지 않고 pygwalker를 사용할 수 있습니다. 예를 들어, 다음과 같은 방식으로 로드된 데이터프레임을 사용하여 PyGWalker를 호출할 수 있습니다.
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df)
그게 다야. 이제 간단한 드래그 앤 드롭 작업으로 데이터를 분석하고 시각화할 수 있는 대화형 UI가 생겼습니다.
PyGwalker로 할 수 있는 멋진 일들:
마크 유형을 다른 유형으로 변경하여 선 차트와 같은 다른 차트를 만들 수 있습니다.
다양한 측정값을 비교하려면 행/열에 둘 이상의 측정값을 추가하여 연결 보기를 만들 수 있습니다.
차원의 값으로 나누어진 여러 하위 뷰의 패싯 보기를 만들려면 차원을 행이나 열에 넣어 패싯 보기를 만듭니다.
PyGWalker에는 데이터와 분포, 프로파일링에 대한 빠른 보기를 제공하는 강력한 데이터 테이블이 포함되어 있습니다. 필터를 추가하거나 표의 데이터 유형을 변경할 수도 있습니다.
데이터 탐색 결과를 로컬 파일에 저장할 수 있습니다.
pygwalker를 사용할 때 알아야 할 몇 가지 중요한 매개변수가 있습니다:
spec
: 차트 구성 저장/로드용(json 문자열 또는 파일 경로)
kernel_computation
: duckdb를 컴퓨팅 엔진으로 사용하여 로컬 머신에서 더 큰 데이터 세트를 더 빠르게 처리할 수 있습니다.
use_kernel_calc
: 더 이상 사용되지 않습니다. 대신 kernel_computation
사용하세요.
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df,spec="./chart_meta_0.json", # 이 json 파일은 차트 상태를 저장하므로 UI에서 저장 버튼을 클릭해야 합니다. mannual 차트 완료 시 '자동 저장'이 향후 지원될 예정입니다.kernel_computation=True, # set `kernel_computation=True`, pygwalker는 duckdb를 컴퓨팅 엔진으로 사용하며 더 큰 데이터 세트(<=100GB) 탐색을 지원합니다.)
노트북 코드: 여기를 클릭하세요
노트북 HTML 미리보기: 여기를 클릭하세요
Kaggle에서 PyGWalker 사용
Google Colab에서 PyGWalker 사용
Streamlit을 사용하면 웹 애플리케이션 작동 방식에 대한 세부 정보를 파악하지 않고도 pygwalker의 웹 버전을 호스팅할 수 있습니다.
다음은 pygwalker 및 streamlit을 사용하여 빌드된 앱 예제 중 일부입니다.
자전거 공유 데이터 세트를 위한 PyGWalker + streamlit
지진 대시보드
from pygwalker.api.streamlit import StreamlitRendererimport pandas as pdimport streamlit as st# Streamlit 페이지의 너비 조정st.set_page_config(page_title="Use Pygwalker In Streamlit",layout="wide")# Add Titlest.title("Pygwalker In 사용 Streamlit")# 메모리를 원하지 않으면 Pygwalker 렌더러를 캐시해야 합니다. 폭발@st.cache_resourcedef get_pyg_renderer() -> "StreamlitRenderer":df = pd.read_csv("./bike_sharing_dc.csv")# 차트 구성 저장 기능을 사용하려면 `spec_io_mode="rw"`return StreamlitRenderer를 설정하세요. (df, spec="./gw_config.json", spec_io_mode="rw")렌더러 = get_pyg_renderer()renderer.explorer()
매개변수 | 유형 | 기본 | 설명 |
---|---|---|---|
데이터 세트 | Union[DataFrame, 커넥터] | - | 사용할 데이터프레임 또는 커넥터입니다. |
기드 | Union[int, str] | 없음 | 'gwalker-{gid}' 형식의 GraphicWalker 컨테이너 div의 ID입니다. |
환경 | 리터럴['Jupyter', 'JupyterWidget'] | '주피터위젯' | pygwalker를 사용하는 환경. |
field_specs | 선택사항[Dict[str, FieldSpec]] | 없음 | 필드 사양. 지정하지 않으면 dataset 에서 자동으로 추론됩니다. |
hide_data_source_config | 부울 | 진실 | True인 경우 DataSource 가져오기 및 내보내기 버튼을 숨깁니다. |
theme_key | 리터럴['베가', 'g2'] | 'g2' | GraphicWalker의 테마 유형입니다. |
모습 | 리터럴['미디어', '밝은', '어두운'] | '메디아' | 테마 설정. '미디어'는 OS 테마를 자동 감지합니다. |
투기 | str | "" | 차트 구성 데이터. 구성 ID, JSON 또는 원격 파일 URL일 수 있습니다. |
사용_미리보기 | 부울 | 진실 | True인 경우 미리보기 기능을 사용합니다. |
커널_계산 | 부울 | 거짓 | True인 경우 데이터에 커널 계산을 사용합니다. |
**크와르그스 | 어느 | - | 추가 키워드 인수. |
참고하세요: 로컬 개발
주피터 노트북
구글 코랩
캐글 코드
주피터 연구소
주피터 라이트
Databricks 노트북(버전 0.1.4a0
부터)
Visual Studio Code용 Jupyter 확장(버전 0.1.4a0
부터)
대부분의 웹 애플리케이션은 IPython 커널과 호환됩니다. (버전 0.1.4a0
부터)
Streamlit(버전 0.1.4.9
부터) , pyg.walk(df, env='Streamlit')
으로 활성화됨
DataCamp 작업공간(버전 0.1.4a0
부터)
패널. 패널 그래픽 워커를 참조하세요.
마리모 (버전 0.4.9.11
부터)
육각 프로젝트
...더 많은 환경에 대해 자유롭게 문제를 제기해 주세요.
pygwalker config
사용하여 개인정보 보호 구성을 설정할 수 있습니다.
$ pygwalker 구성 --help 사용법: pygwalker config [-h] [--set [키=값 ...]] [--reset [키 ...]] [--reset-all] [--list] 구성 파일을 수정합니다. (기본값: ~/Library/Application Support/pygwalker/config.json) 사용 가능한 구성: - 개인 정보 보호 ['오프라인', '업데이트 전용', '이벤트'](기본값: 이벤트)."오프라인": 완전 오프라인, 데이터가 전송되지 않거나 API가 요청되지 않음"업데이트 전용": 이것이 업데이트인지 여부만 확인 "이벤트"를 업데이트하는 pygwalker의 새 버전: pygwalker에서 어떤 기능이 사용되는지에 대한 이벤트를 공유합니다. 여기에는 제품 최적화를 위해 도착하는 기능에 대한 이벤트 데이터만 포함됩니다. 귀하가 분석한 데이터가 전송되지 않습니다. 이벤트 데이터는 타임스탬프를 기반으로 설치될 때 pygwalker에 의해 생성되는 고유 ID와 바인딩됩니다. 우리는 귀하에 관한 다른 정보를 수집하지 않습니다. - kanaries_token ['카나리아 토큰'] (기본값: 빈 문자열). 카나리아 토큰은 https://kanaries.net에서 얻을 수 있습니다. 참조: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries. 카나리아 토큰을 사용하면 공유 차트, 공유 구성과 같은 pygwalker의 카나리아 서비스를 사용할 수 있습니다. 옵션: -h, --help 이 도움말 메시지를 표시하고 종료합니다. --set [키=값 ...] 구성을 설정합니다. 예: "pygwalker config --set 개인 정보 보호=업데이트 전용" --reset [key ...] 사용자 구성을 재설정하고 대신 기본값을 사용합니다. 예: "pygwalker config --reset 개인 정보 보호" --reset-all 모든 사용자 구성을 재설정하고 대신 기본값을 사용합니다. 예: "pygwalker config --reset-all" --list 현재 사용되는 구성을 나열합니다.
자세한 내용은 다음을 참조하세요. 개인 정보 보호 구성을 설정하는 방법은 무엇입니까?
아파치 라이센스 2.0
PyGWalker 클라우드가 출시되었습니다! 이제 차트를 클라우드에 저장하고, 대화형 셀을 웹 앱으로 게시하고, 고급 GPT 기반 기능을 사용할 수 있습니다. 자세한 내용은 PyGWalker Cloud를 확인하세요.
Kanaries에서 PyGWalker에 대한 추가 리소스를 확인하세요. PyGWalker
PyGWalker 논문 PyGWalker: 탐색적 시각적 데이터 분석을 위한 즉각적인 도우미
우리는 또한 AI 기반 자동화를 통해 데이터 랭글링, 탐색 및 시각화의 워크플로우를 재정의하는 오픈 소스, 자동 탐색 데이터 분석 소프트웨어인 RATH를 개발하고 있습니다. 자세한 내용은 Kanaries 웹사이트와 RATH GitHub를 확인하세요!
Youtube: Python에서 PyGWalker로 데이터를 탐색하는 방법
pygwalker를 사용하여 스트림라이트로 시각적 분석 앱 구축
Panel-graphic-walker를 사용하여 Panel로 데이터 시각화 앱을 구축하세요.
문제가 발생하거나 지원이 필요한 경우 Discord 채널에 가입하거나 github에 문제를 제기해 주세요.
마음에 드시면 이러한 소셜 미디어 플랫폼에서 pygwalker를 공유해 보세요!