cuDF (prononcé « KOO-dee-eff ») est une bibliothèque GPU DataFrame permettant de charger, joindre, agréger, filtrer et manipuler des données. cuDF exploite libcudf, une bibliothèque de trames de données C++/CUDA ultra-rapide et le format en colonnes Apache Arrow pour fournir une API pandas accélérée par GPU.
Vous pouvez importer cudf
directement et l'utiliser comme pandas
:
import cudf
tips_df = cudf . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
Vous pouvez également utiliser cuDF comme accélérateur sans changement de code pour les pandas, en utilisant cudf.pandas
. cudf.pandas
prend en charge 100 % de l'API pandas, en utilisant cuDF pour les opérations prises en charge et en recourant à pandas si nécessaire :
% load_ext cudf . pandas # pandas operations now use the GPU!
import pandas as pd
tips_df = pd . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
cudf.pandas
sur une instance gratuite compatible GPU sur Google Colab !Consultez la page d'installation de RAPIDS pour obtenir les informations et les commandes les plus récentes pour l'installation de cuDF et d'autres packages RAPIDS.
cuDF peut être installé via pip
à partir de l'index des packages NVIDIA Python. Assurez-vous de sélectionner le package cuDF approprié en fonction de la version majeure de CUDA disponible dans votre environnement :
Pour CUDA 11.x :
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu11
Pour CUDA 12.x :
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu12
cuDF peut être installé avec conda (via miniforge) depuis le canal rapidsai
:
conda install -c rapidsai -c conda-forge -c nvidia
cudf=25.02 python=3.12 cuda-version=12.5
Nous fournissons également des packages Conda nocturnes construits à partir du HEAD de notre dernière branche de développement.
Remarque : cuDF est pris en charge uniquement sous Linux et avec les versions 3.10 et ultérieures de Python.
Consultez le guide d'installation de RAPIDS pour plus d'informations sur le système d'exploitation et la version.
Voir les instructions de construction.
Veuillez consulter notre guide pour contribuer à cuDF.