Descarga de JetStream - Descargar el código fuente de JetStream

JetStream

Otro código fuente

v0.2.2

Descargar

JetStream es un motor optimizado para el rendimiento y la memoria para la inferencia LLM en los dispositivos XLA.

Acerca de

JetStream es un motor optimizado para el rendimiento y la memoria para la inferencia LLM en los dispositivos XLA, comenzando con TPUS (y GPU en el futuro - PRS bienvenido).

Implementación del motor JetStream

Actualmente, hay dos implementaciones de motores de referencia disponibles: una para modelos JAX y otra para modelos Pytorch.

Jax

Git: https://github.com/google/mextext
Readme: https://github.com/google/jetstream/blob/main/docs/online-inference-with-maxtext-ingine.md

Pytorch

Git: https://github.com/google/jetstream-pytorch
Readme: https://github.com/google/jetstream-pytorch/blob/main/readme.md

Documentación

Inferencia en línea con Maxtext en V5E Cloud TPU VM [ReadMe]
Inferencia en línea con Pytorch en V5E Cloud TPU VM [ReadMe]
Sirva Gemma usando TPUS en GKE con Jetstream
Benchmark Jetstream Server
Observabilidad en el servidor JetStream
Perfil en el servidor JetStream
Configuración local independiente de JetStream

Configuración local independiente de JetStream

Empezando

Configuración

make install-deps

Ejecute el servidor local y las pruebas

Use los siguientes comandos para ejecutar un servidor localmente:

# Start a server
python -m jetstream.core.implementations.mock.server

# Test local mock server
python -m jetstream.tools.requester

# Load test local mock server
python -m jetstream.tools.load_tester

Prueba módulos de núcleo

# Test JetStream core orchestrator
python -m unittest -v jetstream.tests.core.test_orchestrator

# Test JetStream core server library
python -m unittest -v jetstream.tests.core.test_server

# Test mock JetStream engine implementation
python -m unittest -v jetstream.tests.engine.test_mock_engine

# Test mock JetStream token utils
python -m unittest -v jetstream.tests.engine.test_token_utils
python -m unittest -v jetstream.tests.engine.test_utils

Expandir

Información adicional

Versión v0.2.2
Tipo Otro código fuente
Fecha de actualización 2025-02-19
tamaño 2.57MB
Proviene de Github

Aplicaciones relacionadas

waymo open dataset

2024-11-18
Sunamu

2024-12-14
MySchedule.py

2024-12-15
chat.petals.dev

2024-11-30
SmartTube

2024-12-14
viptools for eslam

2024-12-15

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
waymo open dataset

Otro código fuente

December 2023 Update
Sunamu

Otro código fuente

Release 2.2.0
MySchedule.py

Otro código fuente

Updates to the fetching of week codes
waymo open dataset

Otro código fuente

December 2023 Update
termwind

Otras categorias

v2.3.0
wp functions

Otras categorias

1.0.0

Información relacionada Todo