cuDF (pronunciado "KOO-dee-eff") es una biblioteca GPU DataFrame para cargar, unir, agregar, filtrar y manipular datos de otro modo. cuDF aprovecha libcudf, una biblioteca de marcos de datos C++/CUDA ultrarrápida y el formato de columnas Apache Arrow para proporcionar una API de pandas acelerada por GPU.
Puedes importar cudf
directamente y usarlo como pandas
:
import cudf
tips_df = cudf . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
O puede usar cuDF como un acelerador sin cambio de código para pandas, usando cudf.pandas
. cudf.pandas
admite el 100% de la API de pandas, utiliza cuDF para las operaciones admitidas y recurre a pandas cuando es necesario:
% load_ext cudf . pandas # pandas operations now use the GPU!
import pandas as pd
tips_df = pd . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
cudf.pandas
en una instancia gratuita habilitada para GPU en Google Colab.Consulte la página de instalación de RAPIDS para obtener la información y los comandos más actualizados para instalar cuDF y otros paquetes de RAPIDS.
cuDF se puede instalar mediante pip
desde el índice de paquetes de NVIDIA Python. Asegúrese de seleccionar el paquete cuDF apropiado según la versión principal de CUDA disponible en su entorno:
Para CUDA 11.x:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu11
Para CUDA 12.x:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu12
cuDF se puede instalar con conda (a través de miniforge) desde el canal rapidsai
:
conda install -c rapidsai -c conda-forge -c nvidia
cudf=25.02 python=3.12 cuda-version=12.5
También ofrecemos paquetes Conda nocturnos creados a partir del HEAD de nuestra última rama de desarrollo.
Nota: cuDF solo se admite en Linux y con las versiones 3.10 y posteriores de Python.
Consulte la guía de instalación de RAPIDS para obtener más información sobre el sistema operativo y la versión.
Vea las instrucciones de construcción.
Consulte nuestra guía para contribuir a cuDF.