cuDF (ausgesprochen „KOO-dee-eff“) ist eine GPU-DataFrame-Bibliothek zum Laden, Zusammenführen, Aggregieren, Filtern und anderweitigen Bearbeiten von Daten. cuDF nutzt libcudf, eine blitzschnelle C++/CUDA-Datenrahmenbibliothek und das Apache Arrow-Spaltenformat, um eine GPU-beschleunigte Pandas-API bereitzustellen.
Sie können cudf
direkt importieren und wie pandas
verwenden:
import cudf
tips_df = cudf . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
Oder Sie können cuDF mit cudf.pandas
als Beschleuniger für Pandas ohne Codeänderung verwenden. cudf.pandas
unterstützt 100 % der Pandas-API, nutzt cuDF für unterstützte Vorgänge und greift bei Bedarf auf Pandas zurück:
% load_ext cudf . pandas # pandas operations now use the GPU!
import pandas as pd
tips_df = pd . read_csv ( "https://github.com/plotly/datasets/raw/master/tips.csv" )
tips_df [ "tip_percentage" ] = tips_df [ "tip" ] / tips_df [ "total_bill" ] * 100
# display average tip by dining party size
print ( tips_df . groupby ( "size" ). tip_percentage . mean ())
cudf.pandas
auf einer kostenlosen GPU-fähigen Instanz auf Google Colab!Die aktuellsten Informationen und Befehle zur Installation von cuDF und anderen RAPIDS-Paketen finden Sie auf der RAPIDS-Installationsseite.
cuDF kann über pip
aus dem NVIDIA Python Package Index installiert werden. Stellen Sie sicher, dass Sie das entsprechende cuDF-Paket entsprechend der in Ihrer Umgebung verfügbaren Hauptversion von CUDA auswählen:
Für CUDA 11.x:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu11
Für CUDA 12.x:
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu12
cuDF kann mit Conda (über Miniforge) vom rapidsai
-Kanal installiert werden:
conda install -c rapidsai -c conda-forge -c nvidia
cudf=25.02 python=3.12 cuda-version=12.5
Wir bieten auch nächtliche Conda-Pakete an, die aus dem HEAD unseres neuesten Entwicklungszweigs erstellt wurden.
Hinweis: cuDF wird nur unter Linux und mit Python-Versionen 3.10 und höher unterstützt.
Weitere Betriebssystem- und Versionsinformationen finden Sie im RAPIDS-Installationshandbuch.
Siehe Bauanleitung.
Bitte lesen Sie unseren Leitfaden für Beiträge zu cuDF.