Descarga blazingsql - Descarga del código fuente blazingsql

blazingsql

Código Fuente de IA

21.08 Release

Descargar

Un motor SQL ligero, acelerado por GPU, construido sobre el ecosistema RAPIDS.ai.

Comience en app.blazingsql.com

BlazingSQL es un motor SQL acelerado por GPU construido sobre el ecosistema RAPIDS. RAPIDS se basa en el formato de memoria columnar Apache Arrow y cuDF es una biblioteca GPU DataFrame para cargar, unir, agregar, filtrar y manipular datos de otro modo.

BlazingSQL es una interfaz SQL para cuDF, con varias funciones para admitir flujos de trabajo de ciencia de datos y conjuntos de datos empresariales a gran escala.

Consulta de datos almacenados externamente : una sola línea de código puede registrar soluciones de almacenamiento remoto, como Amazon S3.
SQL simple : increíblemente fácil de usar, ejecute una consulta SQL y los resultados son GPU DataFrames (GDF).
Interoperable : cualquier biblioteca RAPIDS puede acceder inmediatamente a los GDF para cargas de trabajo de ciencia de datos.

Pruebe nuestro Cuaderno de bienvenida de 5 minutos para comenzar a usar BlazingSQL y RAPIDS AI.

Empezando

Aquí hay dos fragmentos de BlazingSQL reproducibles de copiar y pegar; siga desplazándose para encontrar cuadernos de ejemplo a continuación.

Cree y consulte una tabla desde un cudf.DataFrame con barra de progreso:

 import cudf

df = cudf . DataFrame ()

df [ 'key' ] = [ 'a' , 'b' , 'c' , 'd' , 'e' ]
df [ 'val' ] = [ 7.6 , 2.9 , 7.1 , 1.6 , 2.2 ]

from blazingsql import BlazingContext
bc = BlazingContext ( enable_progress_bar = True )

bc . create_table ( 'game_1' , df )

bc . sql ( 'SELECT * FROM game_1 WHERE val > 4' ) # the query progress will be shown

	Llave	Valor
0	a	7.6
1	b	7.1

Cree y consulte una tabla desde un depósito de AWS S3:

 from blazingsql import BlazingContext
bc = BlazingContext ()

bc . s3 ( 'blazingsql-colab' , bucket_name = 'blazingsql-colab' )

bc . create_table ( 'taxi' , 's3://blazingsql-colab/yellow_taxi/taxi_data.parquet' )

bc . sql ( 'SELECT passenger_count, trip_distance FROM taxi LIMIT 2' )

	cuenta_pasajeros	importe_tarifa
0	1.0	1.1
1	1.0	0,7

Ejemplos

Título del cuaderno	Descripción	Pruébalo ahora
Cuaderno de bienvenida	Una introducción a los portátiles BlazingSQL y al ecosistema de ciencia de datos GPU.
El marco de datos	Aprenda a utilizar BlazingSQL y cuDF para crear GPU DataFrames con SQL y API similares a Pandas.
Visualización de datos	Conecte sus paquetes de visualización de Python favoritos o utilice herramientas de visualización aceleradas por GPU para representar millones de filas en un instante.
Aprendizaje automático	Obtenga información sobre cuML, que se basa en la API Scikit-Learn y ofrece aprendizaje automático acelerado por GPU en GPU DataFrames.

Documentación

Puede encontrar nuestra documentación completa en docs.blazingdb.com.

Requisitos previos

Anaconda o Miniconda instalada
Soporte de sistema operativo
- Ubuntu 16.04/18.04 LTS
- CentOS 7
Soporte de GPU
- Pascal o mejor
- Capacidad de cómputo >= 6.0
Soporte CUDA
- 11.0
- 11.2
- 11.4
Soporte de Python
- 3.7
- 3.8

Instalar usando Conda

BlazingSQL se puede instalar con conda (miniconda o la distribución completa de Anaconda) desde el canal blazingsql:

Versión estable

conda install -c blazingsql -c rapidsai -c nvidia -c conda-forge -c defaults blazingsql python= $PYTHON_VERSION cudatoolkit= $CUDA_VERSION

Donde $CUDA_VERSION es 11.0, 11.2 o 11.4 y $PYTHON_VERSION es 3.7 o 3.8. Por ejemplo, para CUDA 11.2 y Python 3.8:

conda install -c blazingsql -c rapidsai -c nvidia -c conda-forge -c defaults blazingsql python=3.8 cudatoolkit=11.2

Versión nocturna

Para la versión nocturna, solo se admite cuda 11+, consulte https://github.com/rapidsai/cudf#cudagpu-requirements

conda install -c blazingsql-nightly -c rapidsai-nightly -c nvidia -c conda-forge -c defaults blazingsql python= $PYTHON_VERSION  cudatoolkit= $CUDA_VERSION

Donde $CUDA_VERSION es 11.0, 11.2 o 11.4 y $PYTHON_VERSION es 3.7 o 3.8. Por ejemplo, para CUDA 11.2 y Python 3.8:

conda install -c blazingsql-nightly -c rapidsai-nightly -c nvidia -c conda-forge -c defaults blazingsql python=3.8  cudatoolkit=11.2

Construir/instalar desde la fuente (entorno Conda)

Esta es la forma recomendada de crear todos los componentes y dependencias de BlazingSQL desde el código fuente. Garantiza que todas las dependencias estén disponibles para el proceso de compilación.

Versión estable

Instalar dependencias de compilación

conda create -n bsql python= $PYTHON_VERSION
conda activate bsql
./dependencies.sh 21.08 $CUDA_VERSION

Donde $CUDA_VERSION es 11.0, 11.2 o 11.4 y $PYTHON_VERSION es 3.7 o 3.8. Por ejemplo, para CUDA 11.2 y Python 3.7:

conda create -n bsql python=3.7
conda activate bsql
./dependencies.sh 21.08 11.2

Construir

El proceso de compilación verificará el repositorio de BlazingSQL y lo compilará e instalará en el entorno conda.

 cd $CONDA_PREFIX
git clone https://github.com/BlazingDB/blazingsql.git
cd blazingsql
git checkout main
export CUDACXX=/usr/local/cuda/bin/nvcc
./build.sh

NOTA: Puede hacer ./build.sh -h para ver más opciones de compilación.

$CONDA_PREFIX ahora tiene una carpeta para el repositorio blazingsql.

Versión nocturna

Instalar dependencias de compilación

Para la versión nocturna, solo se admite cuda 11+, consulte https://github.com/rapidsai/cudf#cudagpu-requirements

conda create -n bsql python= $PYTHON_VERSION
conda activate bsql
./dependencies.sh 21.10 $CUDA_VERSION nightly

Donde $CUDA_VERSION es 11.0, 11.2 o 11.4 y $PYTHON_VERSION es 3.7 o 3.8. Por ejemplo, para CUDA 11.2 y Python 3.8:

conda create -n bsql python=3.8
conda activate bsql
./dependencies.sh 21.10 11.2 nightly

Construir

El proceso de compilación verificará el repositorio de BlazingSQL y lo compilará e instalará en el entorno conda.

 cd $CONDA_PREFIX
git clone https://github.com/BlazingDB/blazingsql.git
cd blazingsql
export CUDACXX=/usr/local/cuda/bin/nvcc
./build.sh

NOTA: Puede hacer ./build.sh -h para ver más opciones de compilación.

NOTA: Puede realizar un análisis estático con cppcheck con el comando cppcheck --project=compile_commands.json en cualquiera de los directorios de compilación del proyecto cpp.

$CONDA_PREFIX ahora tiene una carpeta para el repositorio blazingsql.

Complementos de almacenamiento

Para compilar sin los complementos de almacenamiento (AWS S3, Google Cloud Storage), utilice los siguientes argumentos:

 # Disable all storage plugins
./build.sh disable-aws-s3 disable-google-gs

# Disable AWS S3 storage plugin
./build.sh disable-aws-s3

# Disable Google Cloud Storage plugin
./build.sh disable-google-gs

NOTA: Al deshabilitar los complementos de almacenamiento, no es necesario instalar previamente AWS SDK C++ o Google Cloud Storage (ni ninguna de sus dependencias).

Proveedores de SQL

Para compilar sin los proveedores de SQL (MySQL, PostgreSQL, SQLite), utilice los siguientes argumentos:

 # Disable all SQL providers
./build.sh disable-mysql disable-sqlite disable-postgresql

# Disable MySQL provider
./build.sh disable-mysql

...

NOTAS:

Al deshabilitar los complementos de almacenamiento, no necesita instalar mysql-connector-cpp=8.0.23 libpq=13 sqlite=3 (ni ninguna de sus dependencias).
Actualmente solo admitimos MySQL. ¡pero PostgreSQL y SQLite estarán listos para la próxima versión!

Documentación

Las guías de usuario y la documentación de las API públicas se pueden encontrar aquí

Nuestra arquitectura de código interno se puede construir usando Spinx.

conda install -c conda-forge doxygen
cd $CONDA_PREFIX
cd blazingsql/docsrc
pip install -r requirements.txt
make doxygen
make html

La documentación generada se puede ver en un navegador en blazingsql/docsrc/build/html/index.html

Comunidad

Contribuyendo

¿Tiene preguntas o comentarios? Publica un nuevo problema de github.

Consulte nuestra guía para contribuir a BlazingSQL.

Contacto

No dudes en unirte a nuestro canal (#blazingsql) en RAPIDS-GoAi Slack:.

También puede enviarnos un correo electrónico a [email protected] o obtener más detalles en BlazingSQL.com.

Licencia

Licencia Apache 2.0

RAPIDS AI: ciencia de datos de GPU abierta

El conjunto RAPIDS de bibliotecas de software de código abierto tiene como objetivo permitir la ejecución de procesos de análisis y ciencia de datos de un extremo a otro completamente en GPU. Se basa en las primitivas NVIDIA® CUDA® para la optimización informática de bajo nivel, pero exponiendo el paralelismo de la GPU y la velocidad de la memoria de alto ancho de banda a través de interfaces Python fáciles de usar.

Flecha Apache en GPU

La versión GPU de Apache Arrow es una API común que permite el intercambio eficiente de datos tabulares entre procesos que se ejecutan en la GPU. La computación de extremo a extremo en la GPU evita la copia y conversión innecesaria de datos fuera de la GPU, lo que reduce el tiempo de computación y el costo de los análisis de alto rendimiento comunes en las cargas de trabajo de inteligencia artificial. Como su nombre lo indica, cuDF utiliza el formato de datos en columnas Apache Arrow en la GPU. Actualmente, se admite un subconjunto de funciones de Apache Arrow.

Expandir

Información adicional

Versión 21.08 Release
Tipo Código Fuente de IA
Fecha de actualización 2025-01-28
tamaño 35.92MB
Proviene de Github

Aplicaciones relacionadas

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
node telegram bot api

Código Fuente de IA

v0.50.0
typebot.io

Código Fuente de IA

v3.1.2
python wechaty getting started

Código Fuente de IA

1.0.0
waymo open dataset

Otro código fuente

December 2023 Update
wp functions

Otras categorias

1.0.0
termwind

Otras categorias

v2.3.0

Información relacionada Todo