Inglés | Español | Francés | alemán | 中文 | turco | 日本語 | 한국어
PyGWalker puede simplificar el flujo de trabajo de visualización y análisis de datos de Jupyter Notebook al convertir el marco de datos de Pandas en una interfaz de usuario interactiva para la exploración visual.
PyGWalker (pronunciado como "Pig Walker", sólo por diversión) recibe su nombre como una abreviatura de " Python vinculante de G raphic Walker ". Integra Jupyter Notebook con Graphic Walker, una alternativa de código abierto a Tableau. Permite a los científicos de datos visualizar, limpiar y anotar los datos con operaciones simples de arrastrar y soltar e incluso consultas en lenguaje natural.
Visite la demostración en línea de Google Colab, Kaggle Code o Graphic Walker para probarlo.
Si prefiere usar R, consulte GWalkR, el contenedor R de Graphic Walker.
Consulte nuestro video tutorial sobre el uso de pygwalker, pygwalker + streamlit y pygwalker + snowflake, Cómo explorar datos con PyGWalker en Python
Ejecutar en Kaggle | Ejecutar en Colab |
---|---|
Antes de usar pygwalker, asegúrese de instalar los paquetes a través de la línea de comando usando pip o conda.
instalación de pip en pygwalker
Nota
Para una prueba temprana, puede instalar con
pip install pygwalker --upgrade
para mantener su versión actualizada con la última versión o inclusopip install pygwalker --upgrade --pre
para obtener las últimas funciones y correcciones de errores.
instalación de conda -c conda-forge pygwalker
o
instalación de mamba -c conda-forge pygwalker
Consulte materia prima conda-forge para obtener más ayuda.
Importe pygwalker y pandas a su Jupyter Notebook para comenzar.
importar pandas como pdimportar pygwalker como pyg
Puede utilizar pygwalker sin interrumpir su flujo de trabajo existente. Por ejemplo, puedes llamar a PyGWalker con el marco de datos cargado de esta manera:
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df)
Eso es todo. Ahora tiene una interfaz de usuario interactiva para analizar y visualizar datos con operaciones simples de arrastrar y soltar.
Cosas interesantes que puedes hacer con PyGwalker:
Puede cambiar el tipo de marca a otros para crear gráficos diferentes, por ejemplo, un gráfico de líneas:
Para comparar diferentes medidas, puede crear una vista concat agregando más de una medida en filas/columnas.
Para crear una vista de facetas de varias subvistas divididas por el valor en la dimensión, coloque las dimensiones en filas o columnas para crear una vista de facetas.
PyGWalker contiene una potente tabla de datos que proporciona una vista rápida de los datos y su distribución y creación de perfiles. También puede agregar filtros o cambiar los tipos de datos en la tabla.
Puede guardar el resultado de la exploración de datos en un archivo local
Hay algunos parámetros importantes que debes conocer al usar pygwalker:
spec
: para guardar/cargar configuración del gráfico (cadena json o ruta de archivo)
kernel_computation
: para usar duckdb como motor informático que le permite manejar conjuntos de datos más grandes más rápido en su máquina local.
use_kernel_calc
: obsoleto, utilice kernel_computation
en su lugar.
df = pd.read_csv('./bike_sharing_dc.csv')walker = pyg.walk(df,spec="./chart_meta_0.json", # este archivo json guardará el estado de su gráfico, debe hacer clic en el botón Guardar en la interfaz de usuario manual cuando termine un gráfico, se admitirá el 'guardado automático' en el futuro.kernel_computation=True, # set `kernel_computation=True`, pygwalker utilizará duckdb como motor informático, lo que le permitirá explorar un conjunto de datos más grande (<=100 GB).)
Código del cuaderno: haga clic aquí
Vista previa del cuaderno HTML: haga clic aquí
Utilice PyGWalker en Kaggle
Utilice PyGWalker en Google Colab
Streamlit le permite alojar una versión web de pygwalker sin conocer los detalles de cómo funciona la aplicación web.
Estos son algunos de los ejemplos de aplicaciones creadas con pygwalker y streamlit:
PyGWalker + optimizado para el conjunto de datos de bicicletas compartidas
Panel de control de terremotos
from pygwalker.api.streamlit import StreamlitRendererimport pandas as pdimport streamlit as st# Ajustar el ancho de las páginas de Streamlitst.set_page_config(page_title="Usar Pygwalker en Streamlit",layout="wide")# Agregar Titlest.title("Usar Pygwalker en Streamlit")# Debes almacenar en caché tu renderizador pygwalker, si no quieres que tu memoria [email protected]_resourcedef get_pyg_renderer() -> "StreamlitRenderer":df = pd.read_csv("./bike_sharing_dc.csv")# Si desea utilizar la función para guardar la configuración del gráfico, configure `spec_io_mode="rw"`return StreamlitRenderer (df, especificación="./gw_config.json", spec_io_mode="rw")renderer = get_pyg_renderer()renderer.explorer()
Parámetro | Tipo | Por defecto | Descripción |
---|---|---|---|
conjunto de datos | Unión[Marco de datos, Conector] | - | El marco de datos o conector que se utilizará. |
gimiendo | unión[int, str] | Ninguno | ID del div contenedor de GraphicWalker, formateado como 'gwalker-{gid}'. |
ambiente | Literal['Jupyter', 'JupyterWidget'] | 'Widget de Jupyter' | Entorno utilizando pygwalker. |
especificaciones de campo | Opcional[Dict[str, FieldSpec]] | Ninguno | Especificaciones de campos. Se inferirá automáticamente del dataset si no se especifica. |
hide_data_source_config | booleano | Verdadero | Si es Verdadero, oculta el botón de importación y exportación de DataSource. |
tema_key | Literal['vega', 'g2'] | 'g2' | Tipo de tema para GraphicWalker. |
apariencia | Literal['medios', 'claro', 'oscuro'] | 'medios de comunicación' | Configuración del tema. 'media' detectará automáticamente el tema del sistema operativo. |
especulación | cadena | "" | Datos de configuración del gráfico. Puede ser un ID de configuración, JSON o una URL de archivo remoto. |
use_preview | booleano | Verdadero | Si es Verdadero, utiliza la función de vista previa. |
computación_kernel | booleano | FALSO | Si es Verdadero, utiliza el cálculo del kernel para los datos. |
**kwargs | Cualquier | - | Argumentos de palabras clave adicionales. |
Referirlo: desarrollo local
Cuaderno Jupyter
colaboración de google
Código Kaggle
Laboratorio Jupyter
Jupyter Lite
Cuaderno de Databricks (desde la versión 0.1.4a0
)
Extensión Jupyter para Visual Studio Code (desde la versión 0.1.4a0
)
La mayoría de las aplicaciones web son compatibles con los núcleos IPython. (Desde la versión 0.1.4a0
)
Streamlit (desde la versión 0.1.4.9
) , habilitado con pyg.walk(df, env='Streamlit')
Espacio de trabajo DataCamp (desde la versión 0.1.4a0
)
Panel. Ver panel-gráfico-walker.
marimo (Desde la versión 0.4.9.11
)
Proyectos hexagonales
...no dudes en plantear un problema para más entornos.
Puede utilizar pygwalker config
para establecer su configuración de privacidad.
$ configuración de pygwalker --ayuda uso: configuración de pygwalker [-h] [--set [clave=valor...]] [--reset [clave...]] [--reset-all] [--list] Modificar el archivo de configuración. (predeterminado: ~/Biblioteca/Soporte de aplicaciones/pygwalker/config.json) Configuraciones disponibles: - privacidad ['fuera de línea', 'solo actualización', 'eventos'] (predeterminado: eventos). "fuera de línea": completamente fuera de línea, no se envían datos ni se solicita API"solo actualización": solo verifique si se trata de un nueva versión de pygwalker para actualizar"eventos": comparta qué eventos sobre qué característica se usa en pygwalker, solo contiene datos de eventos sobre qué característica llega para la optimización del producto. NO SE ENVÍAN DATOS DE SU ANÁLISIS. Los datos de eventos se vincularán con una identificación única, que genera pygwalker cuando se instala según la marca de tiempo. No recopilaremos ninguna otra información sobre usted. - kanaries_token ['tu token de kanaries'] (predeterminado: cadena vacía). tu token de kanaries, puedes obtenerlo en https://kanaries.net. consulte: https://space.kanaries.net/t/how-to-get-api-key-of-kanaries. Por token de kanaries, puede usar el servicio de kanaries en pygwalker, como compartir gráfico, compartir configuración. opciones: -h, --help muestra este mensaje de ayuda y sale --set [clave=valor...] Establecer configuración. por ejemplo, "pygwalker config --set Privacy=update-only" --reset [tecla...] Restablece la configuración del usuario y utiliza los valores predeterminados en su lugar. por ejemplo, "configuración de pygwalker: restablecer la privacidad" --reset-all Restablece toda la configuración del usuario y utiliza los valores predeterminados en su lugar. por ejemplo, "pygwalker config --reset-all" --list Muestra la configuración utilizada actualmente.
Más detalles, consúltelo: ¿Cómo configurar su configuración de privacidad?
Licencia Apache 2.0
¡Se lanza PyGWalker Cloud! Ahora puede guardar sus gráficos en la nube, publicar la celda interactiva como una aplicación web y utilizar funciones avanzadas impulsadas por GPT. Consulte PyGWalker Cloud para obtener más detalles.
Consulte más recursos sobre PyGWalker en Kanaries PyGWalker
PyGWalker Paper PyGWalker: Asistente sobre la marcha para análisis de datos visuales exploratorios
También estamos trabajando en RATH: un software de análisis de datos exploratorios automatizado de código abierto que redefine el flujo de trabajo de manipulación, exploración y visualización de datos con automatización impulsada por IA. ¡Consulte el sitio web de Kanaries y RATH GitHub para obtener más información!
Youtube: Cómo explorar datos con PyGWalker en Python
Utilice pygwalker para crear una aplicación de análisis visual en Streamlit
Utilice panel-graphic-walker para crear aplicaciones de visualización de datos con Panel.
Si encuentra algún problema y necesita ayuda, únase a nuestro canal de Discord o plantee un problema en github.
¡Comparte pygwalker en estas plataformas de redes sociales si te gusta!