ดาวน์โหลด blazingsql - ดาวน์โหลดซอร์สโค้ด blazingsql

blazingsql

โค้ดแหล่งที่มา AI

21.08 Release

ดาวน์โหลด

เอ็นจิ้น SQL น้ำหนักเบาที่เร่งความเร็วด้วย GPU สร้างขึ้นบนระบบนิเวศ RAPIDS.ai

เริ่มต้นใช้งานบน app.blazingsql.com

BlazingSQL เป็นกลไก SQL ที่เร่งด้วย GPU ที่สร้างขึ้นบนระบบนิเวศ RAPIDS RAPIDS ขึ้นอยู่กับรูปแบบหน่วยความจำเรียงเป็นแนว Apache Arrow และ cuDF คือไลบรารี GPU DataFrame สำหรับการโหลด การรวม การรวม การกรอง และการจัดการข้อมูล

BlazingSQL เป็นอินเทอร์เฟซ SQL สำหรับ cuDF พร้อมฟีเจอร์ต่างๆ เพื่อรองรับเวิร์กโฟลว์วิทยาศาสตร์ข้อมูลขนาดใหญ่และชุดข้อมูลระดับองค์กร

สืบค้นข้อมูลที่จัดเก็บภายนอก - โค้ดบรรทัดเดียวสามารถลงทะเบียนโซลูชันการจัดเก็บข้อมูลระยะไกล เช่น Amazon S3
Simple SQL - ใช้งานง่ายอย่างไม่น่าเชื่อ เรียกใช้แบบสอบถาม SQL และผลลัพธ์คือ GPU DataFrames (GDF)
ทำงานร่วมกันได้ - GDF สามารถเข้าถึงไลบรารี RAPIDS ได้ทันทีสำหรับปริมาณงานด้านวิทยาศาสตร์ข้อมูล

ลองใช้สมุดบันทึกต้อนรับ 5 นาทีของเราเพื่อเริ่มใช้ BlazingSQL และ RAPIDS AI

เริ่มต้นใช้งาน

ต่อไปนี้เป็นตัวอย่างข้อมูล BlazingSQL ที่ทำซ้ำได้ 2 สำเนาและวาง เลื่อนไปเรื่อย ๆ เพื่อค้นหาตัวอย่างสมุดบันทึกด้านล่าง

สร้างและสืบค้นตารางจาก cudf.DataFrame พร้อมแถบความคืบหน้า:

 import cudf

df = cudf . DataFrame ()

df [ 'key' ] = [ 'a' , 'b' , 'c' , 'd' , 'e' ]
df [ 'val' ] = [ 7.6 , 2.9 , 7.1 , 1.6 , 2.2 ]

from blazingsql import BlazingContext
bc = BlazingContext ( enable_progress_bar = True )

bc . create_table ( 'game_1' , df )

bc . sql ( 'SELECT * FROM game_1 WHERE val > 4' ) # the query progress will be shown

	สำคัญ	ค่า
0	ก	7.6
1	ข	7.1

สร้างและสืบค้นตารางจากบัคเก็ต AWS S3:

 from blazingsql import BlazingContext
bc = BlazingContext ()

bc . s3 ( 'blazingsql-colab' , bucket_name = 'blazingsql-colab' )

bc . create_table ( 'taxi' , 's3://blazingsql-colab/yellow_taxi/taxi_data.parquet' )

bc . sql ( 'SELECT passenger_count, trip_distance FROM taxi LIMIT 2' )

	ผู้โดยสาร_นับ	ค่าโดยสาร_จำนวน
0	1.0	1.1
1	1.0	0.7

ตัวอย่าง

ชื่อสมุดบันทึก	คำอธิบาย	ลองตอนนี้
ยินดีต้อนรับโน๊ตบุ๊ค	ข้อมูลเบื้องต้นเกี่ยวกับโน้ตบุ๊ก BlazingSQL และระบบนิเวศวิทยาศาสตร์ข้อมูล GPU
ดาต้าเฟรม	เรียนรู้วิธีใช้ BlazingSQL และ cuDF เพื่อสร้าง GPU DataFrames ด้วย API ที่คล้ายกับ SQL และ Pandas
การแสดงข้อมูล	เสียบแพ็คเกจการแสดงภาพ Python ที่คุณชื่นชอบ หรือใช้เครื่องมือแสดงภาพแบบเร่งด้วย GPU เพื่อเรนเดอร์แถวหลายล้านแถวในพริบตา
การเรียนรู้ของเครื่อง	เรียนรู้เกี่ยวกับ cuML ซึ่งสะท้อนหลังจาก Scikit-Learn API โดยนำเสนอการเรียนรู้ของเครื่องที่เร่งด้วย GPU บน GPU DataFrames

เอกสารประกอบ

คุณสามารถดูเอกสารฉบับเต็มของเราได้ที่ docs.blazingdb.com

ข้อกำหนดเบื้องต้น

ติดตั้งอนาคอนดาหรือมินิคอนดาแล้ว
รองรับระบบปฏิบัติการ
- อูบุนตู 16.04/18.04 LTS
- เซนโอเอส 7
รองรับจีพียู
- ปาสคาลหรือดีกว่า
- ความสามารถในการคำนวณ >= 6.0
การสนับสนุน CUDA
- 11.0
- 11.2
- 11.4
การสนับสนุนหลาม
- 3.7
- 3.8

ติดตั้งโดยใช้ Conda

BlazingSQL สามารถติดตั้งด้วย conda (miniconda หรือการกระจาย Anaconda แบบเต็ม) จากช่องทาง blazingsql:

เวอร์ชันเสถียร

conda install -c blazingsql -c rapidsai -c nvidia -c conda-forge -c defaults blazingsql python= $PYTHON_VERSION cudatoolkit= $CUDA_VERSION

โดยที่ $CUDA_VERSION คือ 11.0, 11.2 หรือ 11.4 และ $PYTHON_VERSION คือ 3.7 หรือ 3.8 ตัวอย่างเช่นสำหรับ CUDA 11.2 และ Python 3.8:

conda install -c blazingsql -c rapidsai -c nvidia -c conda-forge -c defaults blazingsql python=3.8 cudatoolkit=11.2

เวอร์ชั่นกลางคืน

สำหรับเวอร์ชันกลางคืน cuda 11+ รองรับเท่านั้น ดู https://github.com/rapidsai/cudf#cudagpu-requirements

conda install -c blazingsql-nightly -c rapidsai-nightly -c nvidia -c conda-forge -c defaults blazingsql python= $PYTHON_VERSION  cudatoolkit= $CUDA_VERSION

โดยที่ $CUDA_VERSION คือ 11.0, 11.2 หรือ 11.4 และ $PYTHON_VERSION คือ 3.7 หรือ 3.8 ตัวอย่างเช่นสำหรับ CUDA 11.2 และ Python 3.8:

conda install -c blazingsql-nightly -c rapidsai-nightly -c nvidia -c conda-forge -c defaults blazingsql python=3.8  cudatoolkit=11.2

สร้าง/ติดตั้งจากแหล่งที่มา (Conda Environment)

นี่เป็นวิธีที่แนะนำในการสร้างส่วนประกอบ BlazingSQL และการขึ้นต่อกันจากแหล่งที่มาทั้งหมด ช่วยให้มั่นใจได้ว่าการขึ้นต่อกันทั้งหมดจะพร้อมใช้งานสำหรับกระบวนการสร้าง

เวอร์ชันเสถียร

ติดตั้งการพึ่งพาการสร้าง

conda create -n bsql python= $PYTHON_VERSION
conda activate bsql
./dependencies.sh 21.08 $CUDA_VERSION

โดยที่ $CUDA_VERSION คือ 11.0, 11.2 หรือ 11.4 และ $PYTHON_VERSION คือ 3.7 หรือ 3.8 ตัวอย่างเช่นสำหรับ CUDA 11.2 และ Python 3.7:

conda create -n bsql python=3.7
conda activate bsql
./dependencies.sh 21.08 11.2

สร้าง

กระบวนการสร้างจะชำระเงินพื้นที่เก็บข้อมูล BlazingSQL และจะสร้างและติดตั้งในสภาพแวดล้อม conda

 cd $CONDA_PREFIX
git clone https://github.com/BlazingDB/blazingsql.git
cd blazingsql
git checkout main
export CUDACXX=/usr/local/cuda/bin/nvcc
./build.sh

หมายเหตุ: คุณสามารถทำ ./build.sh -h เพื่อดูตัวเลือกบิลด์เพิ่มเติม

$CONDA_PREFIX ขณะนี้มีโฟลเดอร์สำหรับพื้นที่เก็บข้อมูล blazingsql

เวอร์ชั่นกลางคืน

ติดตั้งการพึ่งพาการสร้าง

สำหรับเวอร์ชันกลางคืน cuda 11+ รองรับเท่านั้น ดู https://github.com/rapidsai/cudf#cudagpu-requirements

conda create -n bsql python= $PYTHON_VERSION
conda activate bsql
./dependencies.sh 21.10 $CUDA_VERSION nightly

โดยที่ $CUDA_VERSION คือ 11.0, 11.2 หรือ 11.4 และ $PYTHON_VERSION คือ 3.7 หรือ 3.8 ตัวอย่างเช่นสำหรับ CUDA 11.2 และ Python 3.8:

conda create -n bsql python=3.8
conda activate bsql
./dependencies.sh 21.10 11.2 nightly

สร้าง

กระบวนการสร้างจะชำระเงินพื้นที่เก็บข้อมูล BlazingSQL และจะสร้างและติดตั้งในสภาพแวดล้อม conda

 cd $CONDA_PREFIX
git clone https://github.com/BlazingDB/blazingsql.git
cd blazingsql
export CUDACXX=/usr/local/cuda/bin/nvcc
./build.sh

หมายเหตุ: คุณสามารถทำ ./build.sh -h เพื่อดูตัวเลือกบิลด์เพิ่มเติม

หมายเหตุ: คุณสามารถดำเนินการวิเคราะห์แบบคงที่ด้วย cppcheck ด้วยคำสั่ง cppcheck --project=compile_commands.json ในไดเรกทอรีการสร้างโครงการ cpp ใดๆ

$CONDA_PREFIX ขณะนี้มีโฟลเดอร์สำหรับพื้นที่เก็บข้อมูล blazingsql

ปลั๊กอินจัดเก็บข้อมูล

หากต้องการสร้างโดยไม่มีปลั๊กอินพื้นที่เก็บข้อมูล (AWS S3, Google Cloud Storage) ให้ใช้อาร์กิวเมนต์ถัดไป:

 # Disable all storage plugins
./build.sh disable-aws-s3 disable-google-gs

# Disable AWS S3 storage plugin
./build.sh disable-aws-s3

# Disable Google Cloud Storage plugin
./build.sh disable-google-gs

หมายเหตุ: ด้วยการปิดใช้งานปลั๊กอินพื้นที่เก็บข้อมูล คุณไม่จำเป็นต้องติดตั้ง AWS SDK C++ หรือ Google Cloud Storage ก่อนหน้านี้ (ไม่มีการขึ้นต่อกันใดๆ เลย)

ผู้ให้บริการ SQL

หากต้องการสร้างโดยไม่มีผู้ให้บริการ SQL (MySQL, PostgreSQL, SQLite) ให้ใช้อาร์กิวเมนต์ถัดไป:

 # Disable all SQL providers
./build.sh disable-mysql disable-sqlite disable-postgresql

# Disable MySQL provider
./build.sh disable-mysql

...

หมายเหตุ:

ด้วยการปิดการใช้งานปลั๊กอินการจัดเก็บคุณไม่จำเป็นต้องติดตั้ง mysql-connector-cpp=8.0.23 libpq=13 sqlite=3 (ไม่มีการพึ่งพาใด ๆ )
สกุลเงินที่เรารองรับเฉพาะ MySQL แต่ PostgreSQL และ SQLite จะพร้อมสำหรับเวอร์ชันถัดไป!

เอกสารประกอบ

สามารถดูคู่มือผู้ใช้และเอกสารประกอบ API สาธารณะได้ที่นี่

สถาปัตยกรรมโค้ดภายในของเราสามารถสร้างได้โดยใช้ Spinx

conda install -c conda-forge doxygen
cd $CONDA_PREFIX
cd blazingsql/docsrc
pip install -r requirements.txt
make doxygen
make html

เอกสารที่สร้างขึ้นสามารถดูได้ในเบราว์เซอร์ที่ blazingsql/docsrc/build/html/index.html

ชุมชน

มีส่วนร่วม

มีคำถามหรือข้อเสนอแนะ? โพสต์ปัญหา GitHub ใหม่

โปรดดูคำแนะนำในการสนับสนุน BlazingSQL ของเรา

ติดต่อ

อย่าลังเลที่จะเข้าร่วมช่องของเรา (#blazingsql) ใน RAPIDS-GoAi Slack:

คุณยังสามารถส่งอีเมลถึงเราได้ที่ [email protected] หรือดูรายละเอียดเพิ่มเติมเกี่ยวกับ BlazingSQL.com

ใบอนุญาต

ใบอนุญาต Apache 2.0

RAPIDS AI - วิทยาศาสตร์ข้อมูล GPU แบบเปิด

ชุดไลบรารีซอฟต์แวร์โอเพ่นซอร์ส RAPIDS มุ่งหวังที่จะเปิดใช้งานการดำเนินการไปป์ไลน์วิทยาศาสตร์ข้อมูลและการวิเคราะห์แบบ end-to-end บน GPU ทั้งหมด มันอาศัย NVIDIA® CUDA® ดั้งเดิมสำหรับการเพิ่มประสิทธิภาพการประมวลผลระดับต่ำ แต่เผยให้เห็นความขนานของ GPU และความเร็วหน่วยความจำแบนด์วิธสูงผ่านอินเทอร์เฟซ Python ที่ใช้งานง่าย

Apache Arrow บน GPU

Apache Arrow เวอร์ชัน GPU เป็น API ทั่วไปที่ช่วยให้สามารถแลกเปลี่ยนข้อมูลแบบตารางระหว่างกระบวนการที่ทำงานบน GPU ได้อย่างมีประสิทธิภาพ การคำนวณแบบครบวงจรบน GPU หลีกเลี่ยงการคัดลอกและแปลงข้อมูลที่ไม่จำเป็นจาก GPU ซึ่งช่วยลดเวลาการประมวลผลและต้นทุนสำหรับการวิเคราะห์ประสิทธิภาพสูงซึ่งพบได้ทั่วไปในเวิร์กโหลดปัญญาประดิษฐ์ ตามชื่อที่สื่อถึง cuDF ใช้รูปแบบข้อมูลเรียงเป็นแนว Apache Arrow บน GPU ปัจจุบันรองรับชุดย่อยของคุณสมบัติใน Apache Arrow

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 21.08 Release
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-01-28
ขนาด 35.92MB
มาจาก Github

แอปที่เกี่ยวข้อง

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
node telegram bot api

โค้ดแหล่งที่มา AI

v0.50.0
typebot.io

โค้ดแหล่งที่มา AI

v3.1.2
python wechaty getting started

โค้ดแหล่งที่มา AI

1.0.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด