Télécharger JetStream - Téléchargement du code source de JetStream

JetStream

Autre code source

v0.2.2

Télécharger

Jetsstream est un moteur de débit et optimisé par la mémoire pour l'inférence LLM sur les appareils XLA.

À propos

Jetsstream est un moteur de débit et optimisé par la mémoire pour l'inférence LLM sur les appareils XLA, en commençant par les TPU (et les GPU à l'avenir - les PR bienvenus).

Implémentation du moteur Jetsstream

Actuellement, deux implémentations de moteur de référence sont disponibles - une pour les modèles JAX et une autre pour les modèles Pytorch.

Jax

Git: https://github.com/google/maxtext
Readme: https://github.com/google/jetsstream/blob/main/docs/online-inference-with-maxtext-engine.md

Pytorch

Git: https://github.com/google/jetsstream-pytorch
Readme: https://github.com/google/jetsstream-pytorch/blob/main/readme.md

Documentation

Inférence en ligne avec MaxText sur V5E Cloud TPU VM [Readme]
Inférence en ligne avec Pytorch sur V5E Cloud TPU VM [Readme]
Servir Gemma en utilisant des TPU sur GKE avec Jetsstream
Serveur de référence à Jetsstream
Observabilité dans le serveur Jetsstream
Profilage dans le serveur Jetsstream
Configuration locale autonome de Jetsstream

Configuration locale autonome de Jetsstream

Commencer

Installation

make install-deps

Exécutez le serveur local et les tests

Utilisez les commandes suivantes pour exécuter un serveur localement:

# Start a server
python -m jetstream.core.implementations.mock.server

# Test local mock server
python -m jetstream.tools.requester

# Load test local mock server
python -m jetstream.tools.load_tester

Testez les modules de base

# Test JetStream core orchestrator
python -m unittest -v jetstream.tests.core.test_orchestrator

# Test JetStream core server library
python -m unittest -v jetstream.tests.core.test_server

# Test mock JetStream engine implementation
python -m unittest -v jetstream.tests.engine.test_mock_engine

# Test mock JetStream token utils
python -m unittest -v jetstream.tests.engine.test_token_utils
python -m unittest -v jetstream.tests.engine.test_utils

Développer

Informations supplémentaires

Version v0.2.2
Type Autre code source
Date de mise à jour 2025-02-19
taille 2.57MB
Provenant de Github

Applications connexes

waymo open dataset

2024-11-18
Sunamu

2024-12-14
MySchedule.py

2024-12-15
chat.petals.dev

2024-11-30
SmartTube

2024-12-14
viptools for eslam

2024-12-15

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
waymo open dataset

Autre code source

December 2023 Update
Sunamu

Autre code source

Release 2.2.0
MySchedule.py

Autre code source

Updates to the fetching of week codes
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout