cudf
v24.10.01
cuDF(發音為「KOO-dee-eff」)是一個 GPU DataFrame 函式庫,用於載入、連接、聚合、過濾和以其他方式操作資料。 cuDF 利用 libcudf(一個超快速的 C++/CUDA 資料幀庫)和 Apache Arrow 列格式來提供 GPU 加速的 pandas API。
您可以直接匯入cudf
並像pandas
一樣使用它:
import cudf
tips_df = cudf . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
或者,您可以使用cudf.pandas
將 cuDF 用作 pandas 的無代碼變更加速器。 cudf.pandas
支援 100% 的 pandas API,利用 cuDF 進行支援的操作,並在需要時回退到 pandas:
% load_ext cudf . pandas # pandas operations now use the GPU!
import pandas as pd
tips_df = pd . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
cudf.pandas
!有關安裝 cuDF 和其他 RAPIDS 軟體包的最新資訊和命令,請參閱 RAPIDS 安裝頁面。
cuDF 可以透過 NVIDIA Python 套件索引中的pip
安裝。請務必根據您的環境中可用的 CUDA 主要版本選擇適當的 cuDF 套件:
對於 CUDA 11.x:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu11
對於 CUDA 12.x:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu12
cuDF 可以使用來自rapidsai
頻道的conda(透過miniforge)安裝:
conda install -c rapidsai -c conda-forge -c nvidia
cudf=25.02 python=3.12 cuda-version=12.5
我們還提供從我們最新開發分支的 HEAD 構建的每晚 Conda 軟體包。
注意:cuDF 僅在 Linux 上以及 Python 版本 3.10 及更高版本上支援。
有關更多作業系統和版本信息,請參閱 RAPIDS 安裝指南。
請參閱建置說明。
請參閱我們的 cuDF 貢獻指南。