nnl Unduh - nnl Unduh kode sumber

nnl

Kode Sumber AI

gpt2-xl assets

Unduh

Logika NeuralNet

nnl adalah mesin inferensi untuk model besar pada platform GPU dengan memori rendah.

Isi

Perkenalan
Bangun perpustakaan
Contoh GPT2-XL
Peta jalan
Lisensi
Ucapan Terima Kasih

Perkenalan

Model besar terlalu besar untuk dimasukkan ke dalam memori GPU. nnl mengatasi masalah ini dengan trade-off antara bandwidth PCIE dan memori.

Pipa inferensi yang umum adalah sebagai berikut:

buatlah grafik komputasi menggunakan model dengan $n$ node
mengurutkan topologi setiap node dalam grafik komputasi untuk membuat tabel komputasi
untuk saya di [1, 2, 3, ..., n]:
- jalankan tugas berikut secara asinkron
  - menghitung output dari node i
  - memuat bobot ke GPU untuk node i+1
  - mengalokasikan memori GPU (tensor keluaran dan cahces) untuk node i+1
  - membatalkan alokasi memori GPU (tensor keluaran, bobot, dan cache) untuk node i-1

Dengan kumpulan memori GPU dan defragmentasi memori, NNIL memungkinkan inferensi model besar pada platform GPU kelas bawah.

Bangun perpustakaan

Ini hanyalah proyek hobi yang ditulis dalam beberapa minggu, saat ini hanya backend CUDA yang didukung.

Diuji dengan

gcc 13.2.1
cuda 12.2
tidak ada 8.9.2.26

Bangun perpustakaan statis

nnl _cuda_kernels.a">

make lib nnl _cuda.a && make lib nnl _cuda_kernels.a

Perintah ini akan membangun dua perpustakaan statis: lib/lib nnl _cuda.a dan lib/lib nnl _cuda_kernels.a . Yang pertama adalah perpustakaan inti dengan backend CUDA di C++, dan yang kedua adalah untuk kernel CUDA.

Contoh GPT2-XL

Program demo GPT2-XL (1.6B) disediakan di sini. Program ini dapat dikompilasi dengan perintah ini:

make gpt2_1558m

Setelah mengunduh semua bobot dari rilis, kita dapat menjalankan perintah berikut pada platform GPU kelas bawah seperti GTX 1050 (memori 2 GB):

./bin/gpt2_1558m --max_len 20  " Hi. My name is Feng and I am a machine learning engineer "

Dan outputnya seperti ini:

Penafian: ini hanyalah contoh yang dihasilkan oleh gpt2-xl, saya tidak bekerja di Google dan saya tidak mengenal Randi.

Dan Anda dapat menemukan pola akses memori GPU

Peta jalan

dukungan int8
lebih banyak lapisan
lebih banyak contoh aplikasi
persistensi berat dalam kasus model kecil

Lisensi

PerdamaianOSL

Ucapan Terima Kasih

satu aliran
nlohmann_json
spdlog

Mengapa nnl ?

Memperluas

Informasi Tambahan

Versi gpt2-xl assets
Tipe Kode Sumber AI
Waktu Pembaruan 2024-12-30
ukuran 50MB
Berasal dari Github

Aplikasi Terkait

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
node telegram bot api

Kode Sumber AI

v0.50.0
typebot.io

Kode Sumber AI

v3.1.2
python wechaty getting started

Kode Sumber AI

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua