cuDF("KOO-dee-eff"로 발음)는 데이터 로드, 결합, 집계, 필터링 및 기타 조작을 위한 GPU 데이터프레임 라이브러리입니다. cuDF는 초고속 C++/CUDA 데이터 프레임 라이브러리인 libcudf와 Apache Arrow 열 형식을 활용하여 GPU 가속 Pandas API를 제공합니다.
cudf
직접 가져와 pandas
처럼 사용할 수 있습니다.
import cudf
tips_df = cudf . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
또는 cudf.pandas
사용하여 cuDF를 팬더용 코드 변경 없음 가속기로 사용할 수 있습니다. cudf.pandas
지원되는 작업에 cuDF를 활용하고 필요할 때 pandas로 폴백하여 pandas API를 100% 지원합니다.
% load_ext cudf . pandas # pandas operations now use the GPU!
import pandas as pd
tips_df = pd . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
cudf.pandas
탐색해 보세요!cuDF 및 기타 RAPIDS 패키지 설치에 대한 최신 정보와 명령은 RAPIDS 설치 페이지를 참조하세요.
cuDF는 NVIDIA Python 패키지 인덱스에서 pip
통해 설치할 수 있습니다. 귀하의 환경에서 사용 가능한 CUDA의 주요 버전에 따라 적절한 cuDF 패키지를 선택하십시오.
CUDA 11.x의 경우:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu11
CUDA 12.x의 경우:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu12
cuDF는 rapidsai
채널에서 conda(miniforge를 통해)로 설치할 수 있습니다.
conda install -c rapidsai -c conda-forge -c nvidia
cudf=25.02 python=3.12 cuda-version=12.5
또한 최신 개발 브랜치의 HEAD에서 구축된 야간 Conda 패키지도 제공합니다.
참고: cuDF는 Linux 및 Python 버전 3.10 이상에서만 지원됩니다.
자세한 OS 및 버전 정보는 RAPIDS 설치 가이드를 참조하세요.
빌드 지침을 참조하세요.
cuDF에 기여하려면 가이드를 참조하세요.