cuDF (произносится как «KOO-dee-eff») — это библиотека DataFrame графического процессора для загрузки, объединения, агрегирования, фильтрации и других манипуляций с данными. cuDF использует libcudf, сверхбыструю библиотеку фреймов данных C++/CUDA и столбчатый формат Apache Arrow для предоставления API pandas с ускорением на графическом процессоре.
Вы можете напрямую импортировать cudf
и использовать его как pandas
:
import cudf
tips_df = cudf . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
Или вы можете использовать cuDF в качестве ускорителя без изменения кода для панд, используя cudf.pandas
. cudf.pandas
поддерживает 100% API pandas, используя cuDF для поддерживаемых операций и при необходимости возвращаясь к pandas:
% load_ext cudf . pandas # pandas operations now use the GPU!
import pandas as pd
tips_df = pd . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
cudf.pandas
на бесплатном экземпляре с поддержкой графического процессора в Google Colab!См. страницу установки RAPIDS для получения самой последней информации и команд для установки cuDF и других пакетов RAPIDS.
cuDF можно установить с помощью pip
из индекса пакетов NVIDIA Python. Обязательно выберите соответствующий пакет cuDF в зависимости от основной версии CUDA, доступной в вашей среде:
Для CUDA 11.x:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu11
Для CUDA 12.x:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu12
cuDF можно установить с помощью conda (через miniforge) из канала rapidsai
:
conda install -c rapidsai -c conda-forge -c nvidia
cudf=25.02 python=3.12 cuda-version=12.5
Мы также предоставляем ночные пакеты Conda, созданные на основе HEAD нашей последней ветки разработки.
Примечание. cuDF поддерживается только в Linux и Python версии 3.10 и более поздних.
Дополнительную информацию об ОС и версии см. в руководстве по установке RAPIDS.
См. инструкции по сборке.
Пожалуйста, ознакомьтесь с нашим руководством по участию в cuDF.