Inglês | Espanhol | Français | Alemão | 中文 | Turquia | 日本語 | 한국어
PyGWalker pode simplificar a análise de dados do Jupyter Notebook e o fluxo de trabalho de visualização de dados, transformando o dataframe do pandas em uma interface de usuário interativa para exploração visual.
PyGWalker (pronunciado como "Pig Walker", apenas por diversão) é nomeado como uma abreviatura de " Py thon binding of Graphic Walker ". Ele integra o Jupyter Notebook ao Graphic Walker, uma alternativa de código aberto ao Tableau. Ele permite que os cientistas de dados visualizem/limpem/anotem os dados com operações simples de arrastar e soltar e até mesmo consultas em linguagem natural.
Visite Google Colab, Kaggle Code ou Graphic Walker Online Demo para testar!
Se você preferir usar R, verifique GWalkR, o wrapper R do Graphic Walker.
Confira nosso tutorial em vídeo sobre como usar pygwalker, pygwalker + streamlit e pygwalker + snowflake, Como explorar dados com PyGWalker em Python
Corra em Kaggle | Execute no Colab |
---|---|
Antes de usar o pygwalker, certifique-se de instalar os pacotes através da linha de comando usando pip ou conda.
pip instalar pygwalker
Observação
Para um teste antecipado, você pode instalar com
pip install pygwalker --upgrade
para manter sua versão atualizada com a versão mais recente ou até mesmopip install pygwalker --upgrade --pre
para obter os recursos e correções de bugs mais recentes.
conda install -c conda-forge pygwalker
ou
mamba install -c conda-forge pygwalker
Consulte matéria-prima conda-forge para obter mais ajuda.
Importe pygwalker e pandas para seu Jupyter Notebook para começar.
importar pandas como pdimportar pygwalker como pyg
Você pode usar o pygwalker sem interromper o fluxo de trabalho existente. Por exemplo, você pode acessar o PyGWalker com o dataframe carregado desta forma:
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df)
É isso. Agora você tem uma UI interativa para analisar e visualizar dados com operações simples de arrastar e soltar.
Coisas legais que você pode fazer com PyGwalker:
Você pode alterar o tipo de marca para outros para criar gráficos diferentes, por exemplo, um gráfico de linhas:
Para comparar diferentes medidas, você pode criar uma visualização concat adicionando mais de uma medida em linhas/colunas.
Para criar uma visualização facetada de diversas subvisões divididas pelo valor na dimensão, coloque as dimensões em linhas ou colunas para criar uma visualização facetada.
PyGWalker contém uma tabela de dados poderosa, que fornece uma visão rápida dos dados e sua distribuição, criação de perfil. Você também pode adicionar filtros ou alterar os tipos de dados na tabela.
Você pode salvar o resultado da exploração de dados em um arquivo local
Existem alguns parâmetros importantes que você deve saber ao usar o pygwalker:
spec
: para salvar/carregar configuração do gráfico (string json ou caminho do arquivo)
kernel_computation
: para usar duckdb como mecanismo de computação que permite lidar com conjuntos de dados maiores mais rapidamente em sua máquina local.
use_kernel_calc
: obsoleto, use kernel_computation
.
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df,spec="./chart_meta_0.json", # este arquivo json salvará o estado do seu gráfico, você precisa clicar no botão salvar na interface do usuário manual quando você terminar um gráfico, 'autosave' será suportado no future.kernel_computation=True, # set `kernel_computation=True`, pygwalker usará duckdb como mecanismo de computação, ele permite que você explore um conjunto de dados maior (<= 100 GB).)
Código do caderno: clique aqui
Visualização do Notebook HTML: Clique aqui
Use PyGWalker no Kaggle
Use PyGWalker no Google Colab
Streamlit permite hospedar uma versão web do pygwalker sem descobrir detalhes de como o aplicativo web funciona.
Aqui estão alguns exemplos de aplicativos criados com pygwalker e streamlit:
PyGWalker + streamlit para conjunto de dados de compartilhamento de bicicletas
Painel do terremoto
de pygwalker.api.streamlit import StreamlitRendererimport pandas as pdimport streamlit as st# Ajuste a largura da página Streamlit(page_title="Use Pygwalker In Streamlit",layout="wide")# Add Titlest.title("Use Pygwalker In Streamlit")# Você deve armazenar em cache seu renderizador pygwalker, se não quiser que sua memória [email protected]_resourcedef get_pyg_renderer() -> "StreamlitRenderer":df = pd.read_csv("./bike_sharing_dc.csv")# Se você quiser usar o recurso de salvar configuração do gráfico, defina `spec_io_mode="rw"`return StreamlitRenderer(df, spec= "./gw_config.json", spec_io_mode="rw")renderizador = get_pyg_renderer()renderer.explorer()
Parâmetro | Tipo | Padrão | Descrição |
---|---|---|---|
conjunto de dados | União[DataFrame, Conector] | - | O dataframe ou conector a ser usado. |
gid | União[int,str] | Nenhum | ID do div do contêiner GraphicWalker, formatado como 'gwalker-{gid}'. |
ambiente | Literal['Jupyter', 'JupyterWidget'] | 'Jupyter Widget' | Ambiente usando pygwalker. |
especificações_de_campo | Opcional[Dict[str, FieldSpec]] | Nenhum | Especificações de campos. Será inferido automaticamente do dataset se não for especificado. |
hide_data_source_config | bool | Verdadeiro | Se True, oculta o botão de importação e exportação do DataSource. |
theme_key | Literal['vega', 'g2'] | 'g2' | Tipo de tema para o GraphicWalker. |
aparência | Literal['mídia', 'claro', 'escuro'] | 'mídia' | Configuração do tema. 'media' detectará automaticamente o tema do sistema operacional. |
especificação | str | "" | Dados de configuração do gráfico. Pode ser um ID de configuração, JSON ou URL de arquivo remoto. |
use_preview | bool | Verdadeiro | Se True, usa a função de visualização. |
computação_kernel | bool | Falso | Se True, usa a computação do kernel para dados. |
**kwargs | Qualquer | - | Argumentos adicionais de palavras-chave. |
Consulte: desenvolvimento local
Caderno Jupyter
Google Colab
Código Kaggle
Laboratório Jupyter
Jupyter Lite
Notebook Databricks (desde a versão 0.1.4a0
)
Extensão Jupyter para Visual Studio Code (desde a versão 0.1.4a0
)
A maioria dos aplicativos da web são compatíveis com kernels IPython. (Desde a versão 0.1.4a0
)
Streamlit (desde a versão 0.1.4.9
) , habilitado com pyg.walk(df, env='Streamlit')
Espaço de trabalho DataCamp (desde a versão 0.1.4a0
)
Painel. Veja painel-gráfico-walker.
marimo (desde a versão 0.4.9.11
)
Projetos hexadecimais
... sinta-se à vontade para levantar um problema para mais ambientes.
Você pode usar pygwalker config
para definir sua configuração de privacidade.
$ configuração do pygwalker --help uso: configuração do pygwalker [-h] [--set [key=value ...]] [--reset [key ...]] [--reset-all] [--list] Modifique o arquivo de configuração. (padrão: ~/Library/Application Support/pygwalker/config.json) Configurações disponíveis: - privacidade ['offline', 'somente atualização', 'eventos'] (padrão: eventos)."offline": totalmente offline, nenhum dado é enviado ou API é solicitada"somente atualização": verifique apenas se este é um nova versão do pygwalker para atualizar"eventos": compartilhe quais eventos sobre qual recurso é usado no pygwalker, ele contém apenas dados de eventos sobre qual recurso você chega para otimização do produto. Nenhum dado que você analisa é enviado. Os dados dos eventos serão vinculados a um ID exclusivo, que é gerado pelo pygwalker quando é instalado com base no carimbo de data/hora. Não coletaremos nenhuma outra informação sobre você. - kanaries_token ['seu token kanaries'] (padrão: string vazia). seu token kanaries, você pode obtê-lo em https://kanaries.net. consulte: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries. por token kanaries, você pode usar o serviço kanaries no pygwalker, como gráfico de compartilhamento, configuração de compartilhamento. opções: -h, --help mostra esta mensagem de ajuda e sai --set [chave=valor...] Definir configuração. por exemplo, "configuração do pygwalker --set privacidade = somente atualização" --reset [key ...] Redefine a configuração do usuário e usa valores padrão. por exemplo, "pygwalker config --reset privacidade" --reset-all Redefine todas as configurações do usuário e usa valores padrão. por exemplo, "configuração do pygwalker --reset-all" --list Lista a configuração usada atualmente.
Mais detalhes, consulte: Como definir sua configuração de privacidade?
Licença Apache 2.0
PyGWalker Cloud é lançado! Agora você pode salvar seus gráficos na nuvem, publicar a célula interativa como um aplicativo da web e usar recursos avançados da GPT. Confira o PyGWalker Cloud para mais detalhes.
Confira mais recursos sobre PyGWalker em Kanaries PyGWalker
Artigo PyGWalker PyGWalker: assistente instantâneo para análise exploratória de dados visuais
Também estamos trabalhando no RATH: um software de análise exploratória de dados automatizado e de código aberto que redefine o fluxo de trabalho de organização, exploração e visualização de dados com automação alimentada por IA. Confira o site Kanaries e o RATH GitHub para mais!
Youtube: Como explorar dados com PyGWalker em Python
Use o pygwalker para construir um aplicativo de análise visual em streamlit
Use o panel-graphic-walker para criar aplicativos de visualização de dados com o Panel.
Se você encontrar algum problema e precisar de suporte, entre em nosso canal Discord ou levante um problema no github.
Compartilhe pygwalker nessas plataformas de mídia social se você gostar!