Unduh JetStream - Unduh Kode Sumber JetStream

JetStream

Kode sumber lainnya

v0.2.2

Unduh

JetStream adalah mesin throughput dan memori yang dioptimalkan untuk inferensi LLM pada perangkat XLA.

Tentang

JetStream adalah mesin throughput dan memori yang dioptimalkan untuk inferensi LLM pada perangkat XLA, dimulai dengan TPU (dan GPU di masa depan - PRS Welcome).

Implementasi Mesin Jetstream

Saat ini, ada dua implementasi mesin referensi yang tersedia - satu untuk model JAX dan satu lagi untuk model Pytorch.

Jax

Git: https://github.com/google/maxtext
README: https://github.com/google/jetstream/blob/main/docs/online-lference-with-maxtext-engine.md

Pytorch

Git: https://github.com/google/jetstream-pytorch
README: https://github.com/google/jetstream-pytorch/blob/main/readme.md

Dokumentasi

Inferensi online dengan maxtext di v5e cloud tpu vm [readme]
Inferensi online dengan pytorch di v5e cloud tpu vm [readme]
Sajikan gemma menggunakan TPU di GKE dengan jetstream
Benchmark Jetstream Server
Observabilitas di server jetstream
Profil di server JetStream
Pengaturan Lokal Jetstream Standalone

Pengaturan Lokal Jetstream Standalone

Memulai

Pengaturan

make install-deps

Jalankan server & pengujian lokal

Gunakan perintah berikut untuk menjalankan server secara lokal:

# Start a server
python -m jetstream.core.implementations.mock.server

# Test local mock server
python -m jetstream.tools.requester

# Load test local mock server
python -m jetstream.tools.load_tester

Uji modul inti

# Test JetStream core orchestrator
python -m unittest -v jetstream.tests.core.test_orchestrator

# Test JetStream core server library
python -m unittest -v jetstream.tests.core.test_server

# Test mock JetStream engine implementation
python -m unittest -v jetstream.tests.engine.test_mock_engine

# Test mock JetStream token utils
python -m unittest -v jetstream.tests.engine.test_token_utils
python -m unittest -v jetstream.tests.engine.test_utils

Memperluas

Informasi Tambahan

Versi v0.2.2
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-02-19
ukuran 2.57MB
Berasal dari Github

Aplikasi Terkait

waymo open dataset

2024-11-18
Sunamu

2024-12-14
MySchedule.py

2024-12-15
chat.petals.dev

2024-11-30
SmartTube

2024-12-14
viptools for eslam

2024-12-15

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
waymo open dataset

Kode sumber lainnya

December 2023 Update
Sunamu

Kode sumber lainnya

Release 2.2.0
MySchedule.py

Kode sumber lainnya

Updates to the fetching of week codes
waymo open dataset

Kode sumber lainnya

December 2023 Update
termwind

Kategori lainnya

v2.3.0
wp functions

Kategori lainnya

1.0.0

Informasi Terkait Semua