cudf
v24.10.01
cuDF(发音为“KOO-dee-eff”)是一个 GPU DataFrame 库,用于加载、连接、聚合、过滤和以其他方式操作数据。 cuDF 利用 libcudf(一个超快的 C++/CUDA 数据帧库)和 Apache Arrow 列格式来提供 GPU 加速的 pandas API。
您可以直接导入cudf
并像pandas
一样使用它:
import cudf
tips_df = cudf . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
或者,您可以使用cudf.pandas
将 cuDF 用作 pandas 的无代码更改加速器。 cudf.pandas
支持 100% 的 pandas API,利用 cuDF 进行受支持的操作,并在需要时回退到 pandas:
% load_ext cudf . pandas # pandas operations now use the GPU!
import pandas as pd
tips_df = pd . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
cudf.pandas
!有关安装 cuDF 和其他 RAPIDS 软件包的最新信息和命令,请参阅 RAPIDS 安装页面。
cuDF 可以通过 NVIDIA Python 包索引中的pip
安装。请务必根据您的环境中可用的 CUDA 主要版本选择适当的 cuDF 包:
对于 CUDA 11.x:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu11
对于 CUDA 12.x:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu12
cuDF 可以使用来自rapidsai
频道的conda(通过miniforge)安装:
conda install -c rapidsai -c conda-forge -c nvidia
cudf=25.02 python=3.12 cuda-version=12.5
我们还提供从我们最新开发分支的 HEAD 构建的每晚 Conda 软件包。
注意:cuDF 仅在 Linux 上以及 Python 版本 3.10 及更高版本上受支持。
有关更多操作系统和版本信息,请参阅 RAPIDS 安装指南。
请参阅构建说明。
请参阅我们的 cuDF 贡献指南。