cuDF (pronuncia-se "KOO-dee-eff") é uma biblioteca GPU DataFrame para carregar, unir, agregar, filtrar e manipular dados. cuDF aproveita libcudf, uma biblioteca de dataframe C++/CUDA extremamente rápida e o formato colunar Apache Arrow para fornecer uma API pandas acelerada por GPU.
Você pode importar cudf
diretamente e usá-lo como pandas
:
import cudf
tips_df = cudf . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
Ou você pode usar cuDF como um acelerador sem alteração de código para pandas, usando cudf.pandas
. cudf.pandas
suporta 100% da API pandas, utilizando cuDF para operações suportadas e recorrendo ao pandas quando necessário:
% load_ext cudf . pandas # pandas operations now use the GPU!
import pandas as pd
tips_df = pd . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
cudf.pandas
em uma instância gratuita habilitada para GPU no Google Colab!Consulte a página de instalação do RAPIDS para obter as informações e comandos mais atualizados para instalar o cuDF e outros pacotes RAPIDS.
cuDF pode ser instalado via pip
do NVIDIA Python Package Index. Certifique-se de selecionar o pacote cuDF apropriado dependendo da versão principal do CUDA disponível em seu ambiente:
Para CUDA 11.x:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu11
Para CUDA 12.x:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu12
cuDF pode ser instalado com conda (via miniforge) do canal rapidsai
:
conda install -c rapidsai -c conda-forge -c nvidia
cudf=25.02 python=3.12 cuda-version=12.5
Também fornecemos pacotes Conda noturnos criados a partir do HEAD de nosso ramo de desenvolvimento mais recente.
Nota: cuDF é compatível apenas com Linux e com Python versões 3.10 e posteriores.
Consulte o guia de instalação do RAPIDS para obter mais informações sobre o sistema operacional e a versão.
Consulte as instruções de construção.
Consulte nosso guia para contribuir com cuDF.