تنزيل nnl - تنزيل كود المصدر nnl

nnl

كود الذكاء الاصطناعي

gpt2-xl assets

تنزيل

منطق الشبكة العصبية

nnl هو محرك استدلالي للنماذج الكبيرة على منصة GPU ذات الذاكرة المنخفضة.

محتويات

مقدمة
بناء المكتبة
مثال GPT2-XL
خريطة الطريق
رخصة
شكر وتقدير

مقدمة

النماذج الكبيرة كبيرة جدًا بحيث لا يمكن وضعها في ذاكرة وحدة معالجة الرسومات. يعالج nnl هذه المشكلة من خلال المفاضلة بين عرض النطاق الترددي PCIE والذاكرة.

خط أنابيب الاستدلال النموذجي هو كما يلي:

إنشاء الرسم البياني الحسابي باستخدام نموذج مع $ن$ العقد
قم بفرز طوبولوجي لكل عقدة في الرسم البياني الحسابي لإنشاء جدول حسابي
لأنني في [1، 2، 3، ...، ن]:
- تنفيذ المهام التالية بشكل غير متزامن
  - حساب إخراج العقدة i
  - قم بتحميل الأوزان إلى GPU للعقدة i+1
  - قم بتخصيص ذاكرة GPU (موتر الإخراج وcahces) للعقدة i+1
  - قم بإلغاء تخصيص ذاكرة GPU (موترات الإخراج والأوزان وذاكرة التخزين المؤقت) للعقدة i-1

باستخدام تجمع ذاكرة GPU وإلغاء تجزئة الذاكرة، تتيح NNIL إمكانية استنتاج نموذج كبير على منصة GPU منخفضة النهاية.

بناء المكتبة

هذا مجرد مشروع هواية تمت كتابته في بضعة أسابيع، حاليًا يتم دعم الواجهة الخلفية لـ CUDA فقط.

تم اختباره مع

دول مجلس التعاون الخليجي 13.2.1
كودا12.2
كودن 8.9.2.26

بناء المكتبة الثابتة

nnl_cuda.a && make lib nnl _cuda_kernels.a">

make lib nnl _cuda.a && make lib nnl _cuda_kernels.a

سيقوم هذا الأمر بإنشاء مكتبتين ثابتتين: lib/lib nnl _cuda.a و lib/lib nnl _cuda_kernels.a . الأولى هي المكتبة الأساسية ذات الواجهة الخلفية لـ CUDA في لغة C++، والثانية مخصصة لنواة CUDA.

مثال GPT2-XL

يتوفر هنا برنامج تجريبي لـ GPT2-XL (1.6B). يمكن تجميع هذا البرنامج بواسطة هذا الأمر:

make gpt2_1558m

بعد تنزيل جميع الأوزان من الإصدار، يمكننا تشغيل الأمر التالي على منصة GPU منخفضة مثل GTX 1050 (ذاكرة 2 جيجابايت):

./bin/gpt2_1558m --max_len 20  " Hi. My name is Feng and I am a machine learning engineer "

ويكون الإخراج كالتالي:

إخلاء المسؤولية: هذا مجرد مثال تم إنشاؤه بواسطة gpt2-xl، وأنا لا أعمل في Google ولا أعرف راندي.

ويمكنك العثور على نمط الوصول إلى ذاكرة GPU

خريطة الطريق

دعم int8
المزيد من الطبقات
مزيد من الأمثلة التطبيقات
ثبات الوزن في حالة الموديل الصغير

رخصة

PeaceOSL

شكر وتقدير

com.oneflow
nlohmann_json
com.spdlog

لماذا nnl ؟

يوسع

معلومات إضافية

الإصدار gpt2-xl assets
النوع كود الذكاء الاصطناعي
وقت التحديث 2024-12-30
الحجم 50MB
من Github

تطبيقات ذات صلة

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
node telegram bot api

كود الذكاء الاصطناعي

v0.50.0
typebot.io

كود الذكاء الاصطناعي

v3.1.2
python wechaty getting started

كود الذكاء الاصطناعي

1.0.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
termwind

فئات أخرى

v2.3.0
wp functions

فئات أخرى

1.0.0

أخبار ذات صلة الكل