تنزيل turbopilot - تنزيل كود مصدر turbopilot

turbopilot

ج/ج++

v0.2.1

تنزيل

توربو بايلوت

تم إهمال/أرشفة Turbopilot اعتبارًا من 30/9/23. وهناك حلول أخرى ناضجة تلبي احتياجات المجتمع بشكل أفضل. يرجى قراءة منشور مدونتي حول قراري بإيقاف الأدوات والبدائل الموصى بها.

TurboPilot عبارة عن استنساخ مساعد طيار مستضاف ذاتيًا يستخدم المكتبة الموجودة خلف llama.cpp لتشغيل نموذج Salesforce Codegen المكون من 6 مليارات معلمة في 4 جيجا بايت من ذاكرة الوصول العشوائي. إنه يعتمد بشكل كبير ومستوحى من مشروع fauxpilot.

ملحوظة: هذا دليل على المفهوم في الوقت الحالي وليس أداة مستقرة. الإكمال التلقائي بطيء جدًا في هذا الإصدار من المشروع. لا تتردد في اللعب بها، ولكن قد تختلف المسافة المقطوعة.

تسجيل شاشة للطيار التوربيني الذي يعمل من خلال البرنامج المساعد fauxpilot

يدعم الآن StableCode 3B. قم ببساطة باستخدام نماذج GGML الكمية الخاصة بـ TheBloke وقم بتعيين -m stablecode .

جديد: معاد تصنيعه + مبسط : تم تحسين كود المصدر لتسهيل توسيع وإضافة نماذج جديدة إلى Turbopilot. يدعم النظام الآن نكهات متعددة للنموذج

جديد: دعم Wizardcoder وStarcoder وSantacoder - يدعم Turbopilot الآن أحدث نماذج إكمال التعليمات البرمجية المحلية التي توفر المزيد من لغات البرمجة ودعم "ملء الوسط".

؟ المساهمة

نرحب بشدة بالممثلين الدائمين لهذا المشروع وشوكة GGML المقابلة.

اصنع شوكة، وقم بإجراء التغييرات ثم افتح العلاقات العامة.

ابدء

أسهل طريقة لتجربة المشروع هي الحصول على النماذج التي تمت معالجتها مسبقًا ثم تشغيل الخادم في عامل الإرساء.

الحصول على النماذج

لديك خياران للحصول على النموذج

الخيار أ: التنزيل المباشر - سهل وسريع التشغيل

يمكنك تنزيل النماذج المحولة مسبقًا والمكممة مسبقًا من Huggingface.

بالنسبة لمستخدمي ذاكرة الوصول العشوائي المنخفضة (4-8 جيجا بايت)، أوصي بـ StableCode وللمستخدمين ذوي الطاقة العالية (16+ جيجا بايت من ذاكرة الوصول العشوائي، وحدة معالجة الرسومات المنفصلة أو سيليكون التفاح) أوصي بـ WizardCoder.

لا يزال Turbopilot يدعم نماذج التشفير من الجيل الأول من الإصدار v0.0.5 والإصدارات السابقة. على الرغم من أن النماذج القديمة تحتاج إلى إعادة تكميمها.

يمكنك العثور على كتالوج كامل للنماذج في MODELS.md.

الخيار ب: تحويل النماذج بنفسك - صعب وأكثر مرونة

اتبع هذا الدليل إذا كنت تريد تجربة تحديد كمية النماذج بنفسك.

تشغيل خادم TurboPilot

قم بتنزيل أحدث إصدار ثنائي واستخرجه إلى مجلد المشروع الجذر. إذا لم يتم توفير ملف ثنائي لنظام التشغيل لديك أو كنت تفضل إنشاءه بنفسك، فاتبع تعليمات الإنشاء

يجري:

./turbopilot -m starcoder -f ./models/santacoder-q4_0.bin

يجب أن يبدأ التطبيق خادمًا على المنفذ 18080 ، يمكنك تغيير ذلك باستخدام الخيار -p ولكن هذا هو المنفذ الافتراضي الذي يحاول vscode-fauxpilot الاتصال به، لذا ربما تريد ترك هذا بمفرده إلا إذا كنت متأكدًا من أنك تعرف ما تريد. إعادة القيام.

إذا كان لديك نظام متعدد النواة، فيمكنك التحكم في عدد وحدات المعالجة المركزية المستخدمة من خلال الخيار -t - على سبيل المثال، في جهاز AMD Ryzen 5000 الذي يحتوي على 6 مراكز/12 خيطًا أستخدمه:

./codegen-serve -t 6 -m starcoder -f ./models/santacoder-q4_0.bin

لتشغيل نماذج Codegen القديمة. ما عليك سوى تغيير علامة نوع النموذج -m إلى codegen بدلاً من ذلك.

ملاحظة: يقوم Turbopilot 0.1.0 والأحدث بإعادة تحديد نماذج الكودجين الخاصة بك، والنماذج القديمة من الإصدار 0.0.5 والأقدم. أنا أعمل على تقديم نماذج الترميز الكمي المحدثة

؟ التشغيل من عامل الميناء

يمكنك أيضًا تشغيل Turbopilot من صورة عامل الإرساء المعدة مسبقًا المتوفرة هنا

ستظل بحاجة إلى تنزيل النماذج بشكل منفصل، ثم يمكنك تشغيل:

docker run --rm -it 
  -v ./models:/models 
  -e THREADS=6 
  -e MODEL_TYPE=starcoder 
  -e MODEL= " /models/santacoder-q4_0.bin " 
  -p 18080:18080 
  ghcr.io/ravenscroftj/turbopilot:latest

عامل الميناء وكودا

اعتبارًا من الإصدار v0.0.5، أصبح الرمز التوربيني يدعم الآن استنتاج CUDA. من أجل تشغيل الحاوية الممكّنة لـ cuda، ستحتاج إلى تمكين nvidia-docker، واستخدام الإصدارات الموسومة بـ cuda وتمرير --gpus=all إلى docker مع إمكانية الوصول إلى وحدة معالجة الرسومات الخاصة بك كما يلي:

docker run --gpus=all --rm -it 
  -v ./models:/models 
  -e THREADS=6 
  -e MODEL_TYPE=starcoder 
  -e MODEL= " /models/santacoder-q4_0.bin " 
  -e GPU_LAYERS=32 
  -p 18080:18080 
  ghcr.io/ravenscroftj/turbopilot:v0.2.0-cuda11-7

إذا كان لديك وحدة معالجة رسومات كبيرة بما يكفي، فإن إعداد GPU_LAYERS سيسمح للطيار التوربيني بتفريغ العمليات الحسابية بالكامل على وحدة معالجة الرسومات الخاصة بك بدلاً من نسخ البيانات ذهابًا وإيابًا، مما يؤدي إلى تسريع الاستدلال بشكل كبير.

قم بتبديل ghcr.io/ravenscroftj/turbopilot:v0.1.0-cuda11 لـ ghcr.io/ravenscroftj/turbopilot:v0.2.0-cuda12-0 أو ghcr.io/ravenscroftj/turbopilot:v0.2.0-cuda12-2 إذا كنت تستخدم كودا 12.0 أو 12.2 على التوالي.

ستحتاج إلى CUDA 11 أو CUDA 12 لاحقًا لتشغيل هذه الحاوية. يجب أن تكون قادرًا على رؤية /app/turbopilot مدرجًا عند تشغيل nvidia-smi .

قابل للتنفيذ و CUDA

اعتبارًا من الإصدار 0.0.5، يتوفر إصدار CUDA من نظام التشغيل Linux القابل للتنفيذ - ويتطلب تثبيت libcublas 11 على الجهاز - قد أقوم بإنشاء نظام ubuntu debs في مرحلة ما ولكن التشغيل في الوقت الحالي في عامل الإرساء قد يكون أكثر ملاءمة إذا كنت تريد استخدام كودا GPU.

يمكنك استخدام تفريغ GPU عبر خيار --ngl .

باستخدام واجهة برمجة التطبيقات

دعم البرنامج المساعد Copilot الرسمي

يجري دعم البرنامج المساعد الرسمي لـ VS Code copilot (راجع التذكرة رقم 11). يجب أن تكون واجهة برمجة التطبيقات (API) الآن متوافقة على نطاق واسع مع OpenAI.

استخدام واجهة برمجة التطبيقات (API) مع البرنامج المساعد FauxPilot

لاستخدام واجهة برمجة التطبيقات من VSCode، أوصي باستخدام البرنامج الإضافي vscode-fauxpilot. بمجرد تثبيته، سوف تحتاج إلى تغيير بعض الإعدادات في ملف settings.json الخاص بك.

افتح الإعدادات (CTRL/CMD + SHIFT + P) وحدد Preferences: Open User Settings (JSON)
أضف القيم التالية:

{
    ... // other settings

    "fauxpilot.enabled" : true ,
    "fauxpilot.server" : " http://localhost:18080/v1/engines " ,
}

يمكنك الآن تمكين fauxpilot باستخدام CTRL + SHIFT + P وتحديد Enable Fauxpilot

سيرسل المكون الإضافي استدعاءات واجهة برمجة التطبيقات (API) إلى عملية codegen-serve الجارية عند قيامك بضغطة مفتاح. سينتظر بعد ذلك اكتمال كل طلب قبل إرسال المزيد من الطلبات.

استدعاء API مباشرة

يمكنك تقديم طلبات إلى http://localhost:18080/v1/engines/codegen/completions والتي ستعمل تمامًا مثل نفس نقطة نهاية Copilot.

على سبيل المثال:

curl --request POST 
  --url http://localhost:18080/v1/engines/codegen/completions 
  --header ' Content-Type: application/json ' 
  --data ' {
 "model": "codegen",
 "prompt": "def main():",
 "max_tokens": 100
} '

يجب أن تحصل على شيء مثل هذا:

{
 "choices" : [
  {
   "logprobs" : null ,
   "index" : 0 ,
   "finish_reason" : " length " ,
   "text" : " n  """ Main entry point for this script. """n  logging.getLogger().setLevel(logging.INFO) n  logging.basicConfig(format=('%(levelname)s: %(message)s')) nn  parser = argparse.ArgumentParser( n      description=__doc__, n      formatter_class=argparse.RawDescriptionHelpFormatter, n      epilog=__doc__) n  "
  }
 ],
 "created" : 1681113078 ,
 "usage" : {
  "total_tokens" : 105 ,
  "prompt_tokens" : 3 ,
  "completion_tokens" : 102
 },
 "object" : " text_completion " ,
 "model" : " codegen " ,
 "id" : " 01d7a11b-f87c-4261-8c03-8c78cbe4b067 "
}

القيود المعروفة

يدعم Turbopilot حاليًا جهاز GPU واحدًا فقط في كل مرة (لن يحاول الاستفادة من أجهزة متعددة).

؟ شكر وتقدير

لم يكن هذا المشروع ممكنًا لولا عمل جورجي جيرجانوف على GGML وllama.cpp
لقد كان مستوحى بالكامل من fauxpilot الذي قمت بتجربته لفترة قصيرة ولكنني أردت أن أحاول جعل النماذج تعمل بدون وحدة معالجة الرسومات
يتم تشغيل الواجهة الأمامية للمشروع بواسطة البرنامج المساعد vscode-fauxpilot الخاص بـ Venthe
يستخدم المشروع نماذج Salesforce Codegen.
شكرًا لـ Moyix على عمله في تحويل نماذج Salesforce لتعمل في بنية GPT-J. لا يمنح هذا بعض فوائد السرعة فحسب، بل إنه يسهل أيضًا بالنسبة لي نقل النماذج إلى GGML باستخدام رمز المثال الموجود لـ gpt-j
يستخدم الخادم النموذجي CrowCPP لتقديم الاقتراحات.
تحقق من الورقة العلمية الأصلية لـ CodeGen لمزيد من المعلومات.

يوسع

معلومات إضافية

الإصدار v0.2.1
النوع ج/ج++
وقت التحديث 2024-12-27
الحجم 1.67MB
من Github

تطبيقات ذات صلة

cpp peglib

2025-01-02
vkhr

2024-12-17
carma platform

2024-12-15
qttabbar

2024-12-17
jitify

2024-12-16
kawaii gcc

2024-12-16

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
cpp peglib

ج/ج++

1.0.0
vkhr

ج/ج++

1.0.0
carma platform

ج/ج++

carma-system-4.5.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
wp functions

فئات أخرى

1.0.0
termwind

فئات أخرى

v2.3.0

أخبار ذات صلة الكل