홈페이지>전략정보>소프트웨어 전략

Generative LLM PowerInfer: 단일 GPU에서 실행되어 기계 학습 모델 추론 속도를 11배 높입니다.

저자:Eve Cole 업데이트 시간:2025-01-17 17:00:02