sarathi serve تنزيل - sarathi serve تنزيل كود المصدر

sarathi serve

شفرة المصدر الأخرى

1.0.0

تنزيل

ساراتي-سيرفي

Sarathi-Serve هو إطار عمل لخدمة LLM ذو إنتاجية عالية وزمن وصول منخفض. يرجى الرجوع إلى ورقة OSDI'24 الخاصة بنا لمزيد من التفاصيل.

يثبت

إعداد كودا

تم اختبار Sarathi-Serve باستخدام CUDA 12.3 على وحدات معالجة الرسوميات H100 وA100.

مستودع النسخ

git clone [email protected]:microsoft/sarathi-serve.git

خلق بيئة مامبا

قم بإعداد mamba إذا لم يكن لديك بالفعل،

wget https://github.com/conda-forge/miniforge/releases/latest/download/Mambaforge-Linux-x86_64.sh
bash Mambaforge-Linux-x86_64.sh # follow the instructions from there

إنشاء بيئة بايثون 3.10،

mamba create -p ./env python=3.10

قم بتثبيت Sarathi-Serve

pip install -e . --extra-index-url https://flashinfer.ai/whl/cu121/torch2.3/

إعادة إنتاج النتائج

الرجوع إلى التمهيديات في المجلدات الفردية المقابلة لكل شخصية في osdi-experiments .

الاقتباس

إذا كنت تستخدم عملنا، يرجى النظر في الاستشهاد بمقالتنا:

 @article{agrawal2024taming,
  title={Taming Throughput-Latency Tradeoff in LLM Inference with Sarathi-Serve},
  author={Agrawal, Amey and Kedia, Nitin and Panwar, Ashish and Mohan, Jayashree and Kwatra, Nipun and Gulavani, Bhargav S and Tumanov, Alexey and Ramjee, Ramachandran},
  journal={Proceedings of 18th USENIX Symposium on Operating Systems Design and Implementation, 2024, Santa Clara},
  year={2024}
}

شكر وتقدير

بدأ هذا المستودع في الأصل باعتباره شوكة لمشروع vLLM. يعد Sarathi-Serve نموذجًا أوليًا للبحث ولا يتمتع بتكافؤ كامل في الميزات مع vLLM مفتوح المصدر. لقد احتفظنا فقط بالميزات الأكثر أهمية واعتمدنا قاعدة التعليمات البرمجية لتكرارات البحث بشكل أسرع.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-01-09
الحجم 253.84KB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub the via/releases

2024-11-01

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
SmartTube

شفرة المصدر الأخرى

24.71 Stable
Sunamu

شفرة المصدر الأخرى

Release 2.2.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
wp functions

فئات أخرى

1.0.0
termwind

فئات أخرى

v2.3.0

أخبار ذات صلة الكل