Téléchargement de blazingsql - Téléchargement du code source blazingsql

blazingsql

Code Source AI

21.08 Release

Télécharger

Un moteur SQL léger, accéléré par GPU, construit sur l'écosystème RAPIDS.ai.

Commencez sur app.blazingsql.com

BlazingSQL est un moteur SQL accéléré par GPU construit sur l'écosystème RAPIDS. RAPIDS est basé sur le format de mémoire en colonnes Apache Arrow et cuDF est une bibliothèque GPU DataFrame permettant de charger, joindre, agréger, filtrer et manipuler des données.

BlazingSQL est une interface SQL pour cuDF, avec diverses fonctionnalités pour prendre en charge les flux de travail de science des données à grande échelle et les ensembles de données d'entreprise.

Interroger les données stockées en externe : une seule ligne de code peut enregistrer des solutions de stockage à distance, telles qu'Amazon S3.
SQL simple - incroyablement facile à utiliser, exécutez une requête SQL et les résultats sont des DataFrames GPU (GDF).
Interopérable : les GDF sont immédiatement accessibles à n'importe quelle bibliothèque RAPIDS pour les charges de travail de science des données.

Essayez notre carnet de bienvenue de 5 minutes pour commencer à utiliser BlazingSQL et RAPIDS AI.

Commencer

Voici deux extraits BlazingSQL reproductibles copier-coller. Continuez à faire défiler pour trouver des exemples de blocs-notes ci-dessous.

Créez et interrogez une table à partir d'un cudf.DataFrame avec barre de progression :

 import cudf

df = cudf . DataFrame ()

df [ 'key' ] = [ 'a' , 'b' , 'c' , 'd' , 'e' ]
df [ 'val' ] = [ 7.6 , 2.9 , 7.1 , 1.6 , 2.2 ]

from blazingsql import BlazingContext
bc = BlazingContext ( enable_progress_bar = True )

bc . create_table ( 'game_1' , df )

bc . sql ( 'SELECT * FROM game_1 WHERE val > 4' ) # the query progress will be shown

	Clé	Valeur
0	un	7.6
1	b	7.1

Créez et interrogez une table à partir d'un compartiment AWS S3 :

 from blazingsql import BlazingContext
bc = BlazingContext ()

bc . s3 ( 'blazingsql-colab' , bucket_name = 'blazingsql-colab' )

bc . create_table ( 'taxi' , 's3://blazingsql-colab/yellow_taxi/taxi_data.parquet' )

bc . sql ( 'SELECT passenger_count, trip_distance FROM taxi LIMIT 2' )

	nombre_passagers	montant_tarif
0	1.0	1.1
1	1.0	0,7

Exemples

Titre du cahier	Description	Essayez maintenant
Carnet de bienvenue	Une introduction aux blocs-notes BlazingSQL et à l'écosystème GPU Data Science.
Le DataFrame	Apprenez à utiliser BlazingSQL et cuDF pour créer des DataFrames GPU avec des API SQL et Pandas.
Visualisation des données	Branchez vos packages de visualisation Python préférés ou utilisez les outils de visualisation accélérés par GPU pour restituer des millions de lignes en un éclair.
Apprentissage automatique	Découvrez cuML, mis en miroir après l'API Scikit-Learn, il offre un apprentissage automatique accéléré par GPU sur les DataFrames GPU.

Documentation

Vous pouvez trouver notre documentation complète sur docs.blazingdb.com.

Conditions préalables

Anaconda ou Miniconda installé
Prise en charge du système d'exploitation
- Ubuntu 16.04/18.04 LTS
- CentOS7
Prise en charge des GPU
- Pascal ou mieux
- Capacité de calcul >= 6,0
Prise en charge de CUDA
- 11.0
- 11.2
- 11.4
Prise en charge de Python
- 3.7
- 3.8

Installer à l'aide de Conda

BlazingSQL peut être installé avec conda (miniconda ou la distribution complète d'Anaconda) à partir du canal blazingsql :

Version stable

conda install -c blazingsql -c rapidsai -c nvidia -c conda-forge -c defaults blazingsql python= $PYTHON_VERSION cudatoolkit= $CUDA_VERSION

Où $CUDA_VERSION est 11.0, 11.2 ou 11.4 et $PYTHON_VERSION est 3.7 ou 3.8. Par exemple pour CUDA 11.2 et Python 3.8 :

conda install -c blazingsql -c rapidsai -c nvidia -c conda-forge -c defaults blazingsql python=3.8 cudatoolkit=11.2

Version nocturne

Pour la version nocturne, cuda 11+ est uniquement pris en charge, voir https://github.com/rapidsai/cudf#cudagpu-requirements

conda install -c blazingsql-nightly -c rapidsai-nightly -c nvidia -c conda-forge -c defaults blazingsql python= $PYTHON_VERSION  cudatoolkit= $CUDA_VERSION

Où $CUDA_VERSION est 11.0, 11.2 ou 11.4 et $PYTHON_VERSION est 3.7 ou 3.8. Par exemple pour CUDA 11.2 et Python 3.8 :

conda install -c blazingsql-nightly -c rapidsai-nightly -c nvidia -c conda-forge -c defaults blazingsql python=3.8  cudatoolkit=11.2

Construire/installer à partir de la source (environnement Conda)

Il s'agit de la méthode recommandée pour créer tous les composants et dépendances BlazingSQL à partir des sources. Il garantit que toutes les dépendances sont disponibles pour le processus de construction.

Version stable

Installer les dépendances de build

conda create -n bsql python= $PYTHON_VERSION
conda activate bsql
./dependencies.sh 21.08 $CUDA_VERSION

Où $CUDA_VERSION est 11.0, 11.2 ou 11.4 et $PYTHON_VERSION est 3.7 ou 3.8. Par exemple pour CUDA 11.2 et Python 3.7 :

conda create -n bsql python=3.7
conda activate bsql
./dependencies.sh 21.08 11.2

Construire

Le processus de construction extraira le référentiel BlazingSQL et sera construit et installé dans l'environnement conda.

 cd $CONDA_PREFIX
git clone https://github.com/BlazingDB/blazingsql.git
cd blazingsql
git checkout main
export CUDACXX=/usr/local/cuda/bin/nvcc
./build.sh

REMARQUE : vous pouvez exécuter ./build.sh -h pour voir plus d'options de construction.

$CONDA_PREFIX dispose désormais d'un dossier pour le référentiel blazingsql.

Version nocturne

Installer les dépendances de build

Pour la version nocturne, cuda 11+ est uniquement pris en charge, voir https://github.com/rapidsai/cudf#cudagpu-requirements

conda create -n bsql python= $PYTHON_VERSION
conda activate bsql
./dependencies.sh 21.10 $CUDA_VERSION nightly

Où $CUDA_VERSION est 11.0, 11.2 ou 11.4 et $PYTHON_VERSION est 3.7 ou 3.8. Par exemple pour CUDA 11.2 et Python 3.8 :

conda create -n bsql python=3.8
conda activate bsql
./dependencies.sh 21.10 11.2 nightly

Construire

Le processus de construction extraira le référentiel BlazingSQL et sera construit et installé dans l'environnement conda.

 cd $CONDA_PREFIX
git clone https://github.com/BlazingDB/blazingsql.git
cd blazingsql
export CUDACXX=/usr/local/cuda/bin/nvcc
./build.sh

REMARQUE : vous pouvez exécuter ./build.sh -h pour voir plus d'options de construction.

REMARQUE : Vous pouvez effectuer une analyse statique avec cppcheck avec la commande cppcheck --project=compile_commands.json dans n'importe quel répertoire de construction du projet cpp.

$CONDA_PREFIX dispose désormais d'un dossier pour le référentiel blazingsql.

Plugins de stockage

Pour créer sans les plugins de stockage (AWS S3, Google Cloud Storage), utilisez les arguments suivants :

 # Disable all storage plugins
./build.sh disable-aws-s3 disable-google-gs

# Disable AWS S3 storage plugin
./build.sh disable-aws-s3

# Disable Google Cloud Storage plugin
./build.sh disable-google-gs

REMARQUE : en désactivant les plug-ins de stockage, vous n'avez pas besoin d'installer au préalable AWS SDK C++ ou Google Cloud Storage (ni aucune de ses dépendances).

Fournisseurs SQL

Pour construire sans les fournisseurs SQL (MySQL, PostgreSQL, SQLite), utilisez les arguments suivants :

 # Disable all SQL providers
./build.sh disable-mysql disable-sqlite disable-postgresql

# Disable MySQL provider
./build.sh disable-mysql

...

REMARQUES :

En désactivant les plugins de stockage, vous n'avez pas besoin d'installer mysql-connector-cpp=8.0.23 libpq=13 sqlite=3 (ni aucune de ses dépendances).
Actuellement, nous ne prenons en charge que MySQL. mais PostgreSQL et SQLite seront prêts pour la prochaine version !

Documentation

Les guides d'utilisation et la documentation publique sur les API sont disponibles ici

Notre architecture de code interne peut être construite à l'aide de Spinx.

conda install -c conda-forge doxygen
cd $CONDA_PREFIX
cd blazingsql/docsrc
pip install -r requirements.txt
make doxygen
make html

La documentation générée peut être consultée dans un navigateur à l' blazingsql/docsrc/build/html/index.html

Communauté

Contribuer

Vous avez des questions ou des commentaires ? Publiez un nouveau problème sur GitHub.

Veuillez consulter notre guide pour contribuer à BlazingSQL.

Contact

N'hésitez pas à rejoindre notre chaîne (#blazingsql) dans le RAPIDS-GoAi Slack : .

Vous pouvez également nous envoyer un e-mail à [email protected] ou trouver plus de détails sur BlazingSQL.com.

Licence

Licence Apache 2.0

RAPIDS AI - Science des données GPU ouverte

La suite RAPIDS de bibliothèques de logiciels open source vise à permettre l'exécution de pipelines de science des données et d'analyse de bout en bout entièrement sur des GPU. Il s'appuie sur les primitives NVIDIA® CUDA® pour l'optimisation des calculs de bas niveau, tout en exposant le parallélisme GPU et la vitesse de la mémoire à large bande passante via des interfaces Python conviviales.

Apache Arrow sur GPU

La version GPU d'Apache Arrow est une API commune qui permet un échange efficace de données tabulaires entre les processus exécutés sur le GPU. Le calcul de bout en bout sur le GPU évite la copie et la conversion inutiles des données hors du GPU, réduisant ainsi le temps et les coûts de calcul pour les analyses hautes performances courantes dans les charges de travail d'intelligence artificielle. Comme son nom l'indique, cuDF utilise le format de données en colonnes Apache Arrow sur le GPU. Actuellement, un sous-ensemble des fonctionnalités d'Apache Arrow est pris en charge.

Développer

Informations supplémentaires

Version 21.08 Release
Type Code Source AI
Date de mise à jour 2025-01-28
taille 35.92MB
Provenant de Github

Applications connexes

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
node telegram bot api

Code Source AI

v0.50.0
typebot.io

Code Source AI

v3.1.2
python wechaty getting started

Code Source AI

1.0.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout