unduh lightning thunder - unduh kode sumber lightning thunder

lightning thunder

Kode sumber lainnya

Initial release

Unduh

Jadikan model PyTorch secepat kilat.

Lightning.ai • Performa • Memulai • Instal • Contoh • Inside Thunder • Terlibat! • Dokumentasi

pengujian CI Pemeriksaan umum

Selamat datang di ⚡ Petir Guntur

Thunder membuat model PyTorch secepat kilat.

Thunder adalah kompiler sumber-ke-sumber untuk PyTorch. Itu membuat program PyTorch lebih cepat dengan menggabungkan dan menggunakan pelaksana perangkat keras yang berbeda secara bersamaan (misalnya, nvFuser, torch.compile, cuDNN, dan TransformerEngine FP8).

Ini mendukung konfigurasi tunggal dan multi-GPU. Thunder bertujuan agar dapat digunakan, dimengerti, dan diperluas.

Catatan

Petir Guntur dalam versi alfa. Jangan ragu untuk terlibat, tetapi perkirakan akan ada beberapa kendala di sepanjang jalan.

Performa GPU tunggal

Thunder dapat mencapai percepatan yang signifikan dibandingkan kode PyTorch standar yang tidak dikompilasi ("PyTorch bersemangat"), melalui efek gabungan dari pengoptimalan dan penggunaan eksekutor terbaik di kelasnya. Gambar di bawah menunjukkan throughput prapelatihan untuk Llama 2 7B yang diterapkan di LitGPT.

Seperti yang ditunjukkan dalam plot di atas, Thunder mencapai percepatan 40% dalam throughput pelatihan dibandingkan dengan kode bersemangat pada H100 menggunakan kombinasi eksekutor termasuk nvFuser, torch.compile, cuDNN, dan TransformerEngine FP8.

Performa multi-GPU

Thunder juga mendukung strategi terdistribusi seperti DDP dan FSDP untuk model pelatihan pada beberapa GPU. Plot berikut menampilkan throughput yang dinormalisasi yang diukur untuk Llama 2 7B tanpa presisi campuran FP8; dukungan untuk FSDP sedang berlangsung.

Mulailah

Cara termudah untuk memulai dengan Thunder, tidak memerlukan instalasi atau pengaturan tambahan, adalah dengan menggunakan Studio Tutorial Zero to Thunder kami.

Instal Guntur

Thunder sedang dalam tahap alfa dan perkembangan terbaru sedang terjadi di cabang main . Anda dapat menginstal Thunder versi terbaru dari cabang main sebagai berikut:

pip install git+https://github.com/Lightning-AI/lightning-thunder.git@main

Untuk mencapai performa terbaik, Anda dapat menginstal Thunder dengan dependensi tambahan berikut:

instal nvFuser prarilis yang dibuat untuk PyTorch 2.5.1 sebagai berikut:

 # install nvFuser built for the matching stable PyTorch
pip install --pre nvfuser-cu121-torch25

instal cudnn sebagai berikut:

 # install cudnn
pip install nvidia-cudnn-frontend

Opsi pemasangan lanjutan

Instal untuk bermain-main dan berkontribusi

Jika Anda tertarik untuk mengutak-atik dan berkontribusi pada Thunder, kami sarankan untuk mengkloning repositori Thunder dan menginstalnya dalam mode pip yang dapat diedit:

git clone https://github.com/Lightning-AI/lightning-thunder.git
cd lightning-thunder
pip install -e .

Mengembangkan dan menjalankan tes

Setelah mengkloning repositori Lightning-Thunder dan menginstalnya sebagai paket yang dapat diedit seperti dijelaskan di atas, Anda dapat mengatur lingkungan Anda untuk mengembangkan Thunder dengan menginstal persyaratan pengembangan:

pip install -r requirements/devel.txt

Sekarang Anda menjalankan tes:

pytest thunder/tests

Thunder telah diuji secara menyeluruh, jadi diperkirakan ini akan memakan waktu cukup lama.

Halo Dunia

Di bawah ini adalah contoh sederhana bagaimana Thunder memungkinkan Anda mengkompilasi dan menjalankan kode PyTorch:

 import torch
import thunder


def foo ( a , b ):
    return a + b


jfoo = thunder . jit ( foo )

a = torch . full (( 2 , 2 ), 1 )
b = torch . full (( 2 , 2 ), 3 )

result = jfoo ( a , b )

print ( result )

# prints
# tensor(
#  [[4, 4]
#   [4, 4]])

Fungsi yang dikompilasi jfoo mengambil dan mengembalikan tensor PyTorch, sama seperti fungsi aslinya, sehingga modul dan fungsi yang dikompilasi oleh Thunder dapat digunakan sebagai bagian dari program PyTorch yang lebih besar.

Model kereta api

Thunder sedang dalam tahap awal dan belum boleh digunakan untuk menjalankan produksi.

Namun, ini sudah dapat memberikan kinerja luar biasa untuk pra-pelatihan dan penyempurnaan LLM yang didukung oleh LitGPT, seperti Mistral, Llama 2, Gemma, Falcon, dan lainnya.

Lihat integrasi LitGPT untuk mempelajari cara menjalankan LitGPT dan Thunder secara bersamaan.

Inside Thunder: Sekilas tentang fitur inti

Dengan adanya modul Python callable atau PyTorch, Thunder dapat menghasilkan program yang dioptimalkan yang:

Menghitung lintasan maju dan mundurnya
Menggabungkan operasi ke wilayah fusi yang efisien
Mengirimkan perhitungan ke kernel yang dioptimalkan
Mendistribusikan komputasi secara optimal ke seluruh mesin

Untuk melakukannya, Thunder dikirimkan dengan:

JIT untuk memperoleh program Python yang menargetkan PyTorch dan operasi khusus
Representasi perantara (IR) multi-level untuk merepresentasikan operasi sebagai jejak dari kumpulan operasi yang dikurangi
Satu set transformasi yang dapat diperluas pada jejak grafik komputasi, seperti grad , fusions, terdistribusi (seperti ddp , fsdp ), fungsional (seperti vmap , vjp , jvp )
Sebuah cara untuk mengirimkan operasi ke kumpulan eksekutor yang dapat diperluas

Thunder seluruhnya ditulis dengan Python. Bahkan jejaknya direpresentasikan sebagai Python yang valid di semua tahap transformasi. Hal ini memungkinkan tingkat introspeksi dan perluasan yang belum pernah terjadi sebelumnya.

Thunder tidak menghasilkan kode untuk akselerator, seperti GPU, secara langsung. Ia memperoleh dan mengubah program pengguna sehingga memungkinkan untuk memilih atau menghasilkan kode perangkat secara optimal menggunakan pelaksana cepat seperti:

obor.kompilasi
nvFuser
cuDNN
Puncak
Mesin Transformator
PyTorch bersemangat
Kernel CUDA khusus melalui PyCUDA, Numba, CuPy
Kernel khusus yang ditulis dalam OpenAI Triton

Modul dan fungsi yang dikompilasi dengan Thunder sepenuhnya beroperasi dengan vanilla PyTorch dan mendukung autograd PyTorch. Selain itu, Thunder bekerja bersama torch.compile untuk memanfaatkan optimalisasi canggihnya.

Dokumentasi

Dokumentasi online tersedia. Untuk membuat dokumentasi secara lokal, Anda dapat menggunakan

make docs

dan arahkan browser Anda ke dokumen yang dihasilkan di docs/build/index.html .

Terlibat!

Kami menghargai masukan dan kontribusi Anda. Jika Anda memiliki permintaan fitur, pertanyaan, atau ingin menyumbangkan kode atau file konfigurasi, jangan ragu untuk menggunakan pelacak Masalah GitHub.

Kami menyambut semua kontributor individu, terlepas dari tingkat pengalaman atau perangkat keras mereka. Kontribusi Anda sangat berharga, dan kami sangat senang melihat apa yang dapat Anda capai dalam lingkungan yang kolaboratif dan mendukung ini.