Download JetStream - Download do código fonte JetStream

JetStream

Outro código-fonte

v0.2.2

Baixar

O JetStream é um mecanismo otimizado por taxa de transferência e memória para inferência de LLM em dispositivos XLA.

Sobre

O JetStream é um mecanismo otimizado por taxa de transferência e memória para inferência de LLM em dispositivos XLA, começando com TPUs (e GPUs no futuro - PRS Welcome).

Implementação do motor JetStream

Atualmente, existem duas implementações de mecanismo de referência disponíveis - uma para modelos JAX e outro para modelos Pytorch.

Jax

Git: https://github.com/google/maxtext
Readme: https://github.com/google/Jettream/blob/main/docs/online-inference-with-maxtext-engine.md

Pytorch

Git: https://github.com/google/JetStream-pytorch
Readme: https://github.com/google/Jettream-pytorch/blob/main/readme.md

Documentação

Inferência online com MaxText no V5E Cloud TPU VM [ReadMe]
Inferência on -line com Pytorch no V5E Cloud TPU VM [ReadMe]
Sirva Gemma usando TPUs no GKE com JetStream
Referência do servidor JetStream
Observabilidade no servidor JetStream
Perfil no servidor JetStream
Configuração local independente do JetStream

Configuração local independente do JetStream

Começando

Configurar

make install-deps

Execute o servidor local e testes

Use os seguintes comandos para executar um servidor localmente:

# Start a server
python -m jetstream.core.implementations.mock.server

# Test local mock server
python -m jetstream.tools.requester

# Load test local mock server
python -m jetstream.tools.load_tester

Teste os módulos do núcleo

# Test JetStream core orchestrator
python -m unittest -v jetstream.tests.core.test_orchestrator

# Test JetStream core server library
python -m unittest -v jetstream.tests.core.test_server

# Test mock JetStream engine implementation
python -m unittest -v jetstream.tests.engine.test_mock_engine

# Test mock JetStream token utils
python -m unittest -v jetstream.tests.engine.test_token_utils
python -m unittest -v jetstream.tests.engine.test_utils

Expandir

Informações adicionais

Versão v0.2.2
Tipo Outro código-fonte
Data da Última Atualização 2025-02-19
tamanho 2.57MB
Vindo de Github

Aplicativos Relacionados

waymo open dataset

2024-11-18
Sunamu

2024-12-14
MySchedule.py

2024-12-15
chat.petals.dev

2024-11-30
SmartTube

2024-12-14
viptools for eslam

2024-12-15

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
waymo open dataset

Outro código-fonte

December 2023 Update
Sunamu

Outro código-fonte

Release 2.2.0
MySchedule.py

Outro código-fonte

Updates to the fetching of week codes
waymo open dataset

Outro código-fonte

December 2023 Update
termwind

Outras categorias

v2.3.0
wp functions

Outras categorias

1.0.0

Informações Relacionadas Todos