تنزيل FasterTransformer - تنزيل كود مصدر FasterTransformer

FasterTransformer

كود الذكاء الاصطناعي

v5.3 release

تنزيل

ملاحظة: انتقل تطوير FasterTransformer إلى TensorRT-LLM. يتم تشجيع جميع المطورين على الاستفادة من TensorRT-LLM للحصول على أحدث التحسينات على LLM Inference. سيبقى مستودع NVIDIA/FasterTransformer قائمًا، لكن لن يكون لديه مزيد من التطوير.

محول أسرع

يوفر هذا المستودع برنامجًا نصيًا ووصفة لتشغيل مكون التشفير ووحدة فك التشفير المعتمد على المحولات، ويتم اختباره وصيانته بواسطة NVIDIA.

جدول المحتويات

محول أسرع
- جدول المحتويات
- نظرة عامة على النموذج
  - مصفوفة الدعم
- متقدم
  - البيئة العالمية
- أداء
  - أداء قاعدة بيرت
    - أداء BERT الأساسي لميزات FasterTransformer الجديدة
    - أداء BERT الأساسي على TensorFlow
    - أداء قاعدة BERT على PyTorch
  - أداء فك التشفير وفك التشفير
    - أداء فك التشفير وفك التشفير من البداية إلى النهاية على TensorFlow
    - أداء فك التشفير وفك التشفير من طرف إلى طرف على PyTorch
  - أداء جي بي تي
- ملاحظات الإصدار
  - سجل التغيير
  - القضايا المعروفة

نظرة عامة على النموذج

في البرمجة اللغوية العصبية، يعد التشفير ووحدة فك التشفير عنصرين مهمين، حيث أصبحت طبقة المحولات بنية شائعة لكلا المكونين. يطبق FasterTransformer طبقة محولات محسنة للغاية لكل من جهاز التشفير ووحدة فك التشفير للاستدلال. في وحدات معالجة الرسوميات Volta وTuring وAmpere، يتم استخدام قوة الحوسبة لـ Tensor Cores تلقائيًا عندما تكون دقة البيانات والأوزان FP16.

تم بناء FasterTransformer على أساس CUDA، وcuBLAS، وcuBLASLT، وC++. نحن نقدم واجهة برمجة تطبيقات واحدة على الأقل من الأطر التالية: TensorFlow وPyTorch وTriton backend. يمكن للمستخدمين دمج FasterTransformer في هذه الأطر مباشرة. بالنسبة لأطر العمل الداعمة، نقدم أيضًا رموز أمثلة لتوضيح كيفية الاستخدام وإظهار الأداء على هذه الأطر.

مصفوفة الدعم

نماذج	نطاق	FP16	INT8 (بعد تورينج)	سبارسيتي (بعد الأمبير)	الموتر الموازي	خط الأنابيب موازي	FP8 (بعد هوبر)
بيرت	TensorFlow	نعم	نعم	-	-	-	-
بيرت	باي تورش	نعم	نعم	نعم	نعم	نعم	-
بيرت	تريتون الخلفية	نعم	-	-	نعم	نعم	-
بيرت	سي ++	نعم	نعم	-	-	-	نعم
XLNet	سي ++	نعم	-	-	-	-	-
التشفير	TensorFlow	نعم	نعم	-	-	-	-
التشفير	باي تورش	نعم	نعم	نعم	-	-	-
فك التشفير	TensorFlow	نعم	-	-	-	-	-
فك التشفير	باي تورش	نعم	-	-	-	-	-
فك التشفير	TensorFlow	نعم	-	-	-	-	-
فك التشفير	باي تورش	نعم	-	-	-	-	-
جي بي تي	TensorFlow	نعم	-	-	-	-	-
جي بي تي/أو بي تي	باي تورش	نعم	-	-	نعم	نعم	نعم
جي بي تي/أو بي تي	تريتون الخلفية	نعم	-	-	نعم	نعم	-
GPT-وزارة التربية والتعليم	باي تورش	نعم	-	-	نعم	نعم	-
يزدهر	باي تورش	نعم	-	-	نعم	نعم	-
يزدهر	تريتون الخلفية	نعم	-	-	نعم	نعم	-
جي بي تي-ي	تريتون الخلفية	نعم	-	-	نعم	نعم	-
منذ فترة طويلة	باي تورش	نعم	-	-	-	-	-
T5/UL2	باي تورش	نعم	-	-	نعم	نعم	-
T5	تدفق Tensor 2	نعم	-	-	-	-	-
T5/UL2	تريتون الخلفية	نعم	-	-	نعم	نعم	-
T5	TensorRT	نعم	-	-	نعم	نعم	-
T5-وزارة البيئة	باي تورش	نعم	-	-	نعم	نعم	-
محول سوين	باي تورش	نعم	نعم	-	-	-	-
محول سوين	TensorRT	نعم	نعم	-	-	-	-
فيتامين	باي تورش	نعم	نعم	-	-	-	-
فيتامين	TensorRT	نعم	نعم	-	-	-	-
جي بي تي-نيوإكس	باي تورش	نعم	-	-	نعم	نعم	-
جي بي تي-نيوإكس	تريتون الخلفية	نعم	-	-	نعم	نعم	-
بارت/مبارت	باي تورش	نعم	-	-	نعم	نعم	-
وي نت	سي ++	نعم	-	-	-	-	-
ديبيرتا	تدفق Tensor 2	نعم	-	-	مستمرة	مستمرة	-
ديبيرتا	باي تورش	نعم	-	-	مستمرة	مستمرة	-

لاحظ أن FasterTransformer يدعم النماذج المذكورة أعلاه في C++ لأن جميع أكواد المصدر مبنية على C++.

تم وضع المزيد من التفاصيل حول نماذج محددة في xxx_guide.md من docs/ ، حيث يعني xxx اسم النموذج. يتم وضع بعض الأسئلة الشائعة والإجابات الخاصة بها في docs/QAList.md . لاحظ أن نموذج Encoder وBERT متشابهان وقمنا بوضع الشرح في bert_guide.md معًا.

متقدم

يسرد التعليمة البرمجية التالية بنية دليل FasterTransformer:

 /src/fastertransformer: source code of FasterTransformer
    |--/cutlass_extensions: Implementation of cutlass gemm/kernels.
    |--/kernels: CUDA kernels for different models/layers and operations, like addBiasResiual.
    |--/layers: Implementation of layer modules, like attention layer, ffn layer.
    |--/models: Implementation of different models, like BERT, GPT.
    |--/tensorrt_plugin: encapluate FasterTransformer into TensorRT plugin.
    |--/tf_op: custom Tensorflow OP implementation
    |--/th_op: custom PyTorch OP implementation
    |--/triton_backend: custom triton backend implementation
    |--/utils: Contains common cuda utils, like cublasMMWrapper, memory_utils
/examples: C++, tensorflow and pytorch interface examples
    |--/cpp: C++ interface examples
    |--/pytorch: PyTorch OP examples
    |--/tensorflow: TensorFlow OP examples
    |--/tensorrt: TensorRT examples
/docs: Documents to explain the details of implementation of different models, and show the benchmark
/benchmark: Contains the scripts to run the benchmarks of different models
/tests: Unit tests
/templates: Documents to explain how to add a new model/example into FasterTransformer repo

لاحظ أن العديد من المجلدات تحتوي على العديد من المجلدات الفرعية لتقسيم النماذج المختلفة. يتم نقل أدوات التكميم إلى examples ، مثل examples/tensorflow/bert/bert-quantization/ و examples/pytorch/bert/bert-quantization-sparsity/ .

البيئة العالمية

يوفر FasterTransformer بعض متغيرات البيئة الملائمة لتصحيح الأخطاء والاختبار.

FT_LOG_LEVEL : تتحكم هذه البيئة في مستوى السجل لرسائل تصحيح الأخطاء. مزيد من التفاصيل موجودة في src/fastertransformer/utils/logger.h . لاحظ أن البرنامج سيقوم بطباعة الكثير من الرسائل عندما يكون المستوى أقل من DEBUG وسيصبح البرنامج بطيئًا جدًا.
FT_NVTX : إذا تم ضبطه على ON مثل FT_NVTX=ON ./bin/gpt_example ، فسيقوم البرنامج بإدراج علامة nvtx للمساعدة في تحديد ملف تعريف البرنامج.
FT_DEBUG_LEVEL : إذا تم ضبطه على DEBUG ، فسيقوم البرنامج بتشغيل cudaDeviceSynchronize() بعد كل نواة. وبخلاف ذلك، سيتم تنفيذ النواة بشكل غير متزامن بشكل افتراضي. من المفيد تحديد موقع نقطة الخطأ أثناء التصحيح. لكن هذه العلامة تؤثر على أداء البرنامج بشكل كبير. لذا، يجب استخدامه فقط لتصحيح الأخطاء.

أداء

إعدادات الأجهزة:

8xA100-80 جيجابايت (مع mclk 1593 ميجا هرتز، pclk 1410 ميجا هرتز) مع معالج AMD EPYC 7742 64-Core
T4 (مع mclk 5000 ميجا هرتز، pclk 1590 ميجا هرتز) مع وحدة المعالجة المركزية Intel(R) Xeon(R) E5-2670 0 @ 2.60 جيجا هرتز

من أجل تشغيل المعيار التالي، نحتاج إلى تثبيت أداة حوسبة يونكس "bc" بواسطة

apt-get install bc

أداء قاعدة بيرت

تم الحصول على نتائج FP16 لـ TensorFlow عن طريق تشغيل benchmarks/bert/tf_benchmark.sh .

تم الحصول على نتائج INT8 لـ TensorFlow عن طريق تشغيل benchmarks/bert/tf_int8_benchmark.sh .

تم الحصول على نتائج FP16 لـ PyTorch عن طريق تشغيل benchmarks/bert/pyt_benchmark.sh .

تم الحصول على نتائج INT8 لـ PyTorch عن طريق تشغيل benchmarks/bert/pyt_int8_benchmark.sh .

يتم وضع المزيد من المعايير في docs/bert_guide.md .

أداء BERT الأساسي لميزات FasterTransformer الجديدة

يقارن الشكل التالي أداء الميزات المختلفة لـ FasterTransformer وFasterTransformer ضمن FP16 على T4.

بالنسبة لحجم الدفعة الكبير وطول التسلسل، يحقق كل من EFF-FT وFT-INT8-v2 سرعة مضاعفة. يمكن أن يؤدي استخدام FasterTransformer الفعال وint8v2 في نفس الوقت إلى تسريع 3.5x مقارنة بـ FasterTransformer FP16 للحالة الكبيرة.

أداء BERT الأساسي على TensorFlow

يقارن الشكل التالي أداء الميزات المختلفة لـ FasterTransformer وTensorFlow XLA ضمن FP16 على T4.

بالنسبة لحجم الدفعة الصغيرة وطول التسلسل، يمكن أن يؤدي استخدام FasterTransformer إلى تسريع 3x.

بالنسبة لحجم الدفعة الكبيرة وطول التسلسل، يمكن أن يؤدي استخدام FasterTransformer الفعال مع تكميم INT8-v2 إلى تسريع 5x.

أداء قاعدة BERT على PyTorch

يقارن الشكل التالي أداء الميزات المختلفة لـ FasterTransformer وPyTorch TorchScript ضمن FP16 على T4.

بالنسبة لحجم الدفعة الصغيرة وطول التسلسل، يمكن أن يؤدي استخدام FasterTransformer CustomExt إلى تسريع 4x ~ 6x.

بالنسبة لحجم الدفعة الكبيرة وطول التسلسل، يمكن أن يؤدي استخدام FasterTransformer الفعال مع تكميم INT8-v2 إلى تسريع 5x.

أداء فك التشفير وفك التشفير

تم الحصول على نتائج TensorFlow عن طريق تشغيل benchmarks/decoding/tf_decoding_beamsearch_benchmark.sh و benchmarks/decoding/tf_decoding_sampling_benchmark.sh

تم الحصول على نتائج PyTorch عن طريق تشغيل benchmarks/decoding/pyt_decoding_beamsearch_benchmark.sh .

في تجارب فك التشفير قمنا بتحديث المعلمات التالية:

رأس_رقم = 8
حجم_الرأس = 64
num_layers = 6 لكل من التشفير ووحدة فك التشفير
Dictionary_size = 32001 لرموز عينة TensorFlow، و31538 لأكواد عينة PyTorch
الذاكرة_المخفية_ديم = 512
الحد الأقصى لطول التسلسل = 128

يتم وضع المزيد من المعايير في docs/decoder_guide.md .

أداء فك التشفير وفك التشفير من البداية إلى النهاية على TensorFlow

يوضح الشكل التالي مدى سرعة عمليتي FT-Decoder و FT-Decoding مقارنة بـ TensorFlow تحت FP16 مع T4. هنا، نستخدم إنتاجية ترجمة مجموعة اختبار لمنع اختلاف الرموز المميزة لكل طريقة. بالمقارنة مع TensorFlow، يوفر FT-Decoder سرعة 1.5x ~ 3x؛ بينما يوفر FT-Decoding سرعة تصل إلى 4x ~ 18x.

أداء فك التشفير وفك التشفير من طرف إلى طرف على PyTorch

يوضح الشكل التالي مدى سرعة عمليتي FT-Decoder وFT-Decoding مقارنة بـ PyTorch تحت FP16 مع T4. هنا، نستخدم إنتاجية ترجمة مجموعة اختبار لمنع اختلاف الرموز المميزة لكل طريقة. بالمقارنة مع PyTorch، يوفر FT-Decoder سرعة تصل إلى 1.2x ~ 3x؛ بينما يوفر FT-Decoding سرعة تصل إلى 3.8x ~ 13x.

أداء جي بي تي

يقارن الشكل التالي أداء Megatron و FasterTransformer تحت FP16 على A100.

في تجارب فك التشفير قمنا بتحديث المعلمات التالية:

رأس_الرقم = 96
حجم_الرأس = 128
num_layers = 48 للطراز GPT-89B، 96 للطراز GPT-175B
نوع البيانات = FP16
حجم المفردة = 51200
top_p = 0.9
الحجم الموازي للموتر = 8
طول تسلسل الإدخال = 512
طول تسلسل الإخراج = 32

ملاحظات الإصدار

سجل التغيير

مايو 2023

إصلاح أخطاء الجيل التوقف المبكر

يناير 2023

دعم GPT وزارة التربية
دعم FP8 لبيرت وGPT ( تجريبي )
دعم DeBERTa على TensorFlow 2 وPyTorch

ديسمبر 2022

الافراج عن FasterTransformer 5.2
دعم الحد الأدنى لعقوبة الطول

نوفمبر 2022

دعم T5 Tensorflow 2 المرجع المخصص.
دعم T5 وزارة التعليم
دعم وي نت
دعم بارت وmBART
دعم سوينV2
الدعم الأولي لوضع w8a8 int8 مع GPT (معاينة)
دعم تنصهر MHA في GPT

أكتوبر 2022

دعم بلوم

سبتمبر 2022

دعم أخذ العينات الواقعية (رابط) في gpt
دعم نظام التكيف IA3 في T5

أغسطس 2022

دعم إرجاع تضمينات الرموز المميزة للسياق في GPT
الافراج عن FasterTransformer 5.1
دعم الجيل التفاعلي
دعم الذاكرة محدودة الوقت الاهتمام
دعم MT5 وT5-V1.1

يوليو 2022

دعم UL2 Huggingface ckpt. (وصلة)
- إصلاح الخلل في T5 ضمن bfloat16.
إضافة البرنامج المساعد ViT INT8 TensorRT
دعم أخذ العينات دفعة
دعم تحسين السياق المشترك في نموذج GPT

يونيو 2022

دعم توليد التدفق للواجهة الخلفية تريتون.
دعم الأراضي الفلسطينية المحتلة.
دعم وحدة معالجة الرسومات متعددة العقد BERT ضمن FP32 وFP16 وBF16.

مايو 2022

دعم bfloat16 في معظم الموديلات.
دعم موجه البادئة لـ GPT-J.
دعم جي بي تي-نيوكس.
- أصبحت قيمة epsilon المستخدمة في Layernorm الآن معلمة
- التضمين الدوار بأسلوب GPT-NeoX (تم تنفيذ GPT-J فقط)
- تحميل معلمات الطبقة والتحيز لكل وحدة معالجة رسومات
- تحويل الوزن من نقطة تفتيش EleutherAI

أبريل 2022

الافراج عن FasterTransformer 5.0
- قم بتغيير نوع التراكم الافتراضي لجميع الأحجار الكريمة إلى FP32.
- دعم الاستدلال bfloat16 في نموذج GPT.
- يدعم طراز Nemo Megatron T5 وMegatron-LM T5.
- دعم فيت.

مارس 2022

دعم stop_ids و ban_bad_ids في GPT-J.
دعم start_id الديناميكي و end_id في GPT-J وGPT وT5 وفك التشفير.

فبراير 2022

دعم محول سوين.
تحسين تحديث ذاكرة التخزين المؤقت k/v للبحث عن الشعاع بواسطة المخزن المؤقت في الاتجاه.
دعم إدخال وقت التشغيل لـ GPT-J وT5 وGPT.
دعم المطالبة الناعمة في GPT وGPT-J.
دعم مخصص لجميع تقليل النواة.
- الحد:
  1. يدعم فقط الحجم الموازي للموتر = 8 على DGX-A100.
  2. دعم CUDA فقط مع cudaMallocAsync.

ديسمبر 2021

إضافة البرنامج المساعد TensorRT لنموذج T5.
قم بتغيير بعض المعلمات الفائقة لنموذج GPT إلى استعلام وقت التشغيل.
تحسين مخصص الذاكرة ضمن رمز C++.
إصلاح الخلل في CUB بما في ذلك عند استخدام CUDA 11.5 أو إصدار أحدث.

نوفمبر 2021

قم بتحديث الإصدار التجريبي FasterTransformer 5.0
أضف قياس وزن GPT-3 INT8 فقط لحجم الدفعة <= 2.
دعم دعم GPU متعدد العقد على T5.
تعزيز دعم GPU متعدد العقد في GPT-3.

أغسطس 2021

قم بإصدار النسخة التجريبية من FasterTransformer 5.0
- إعادة بناء الريبو والرموز
- وشكر خاص لشركة NAVER Corp لمساهمتها الكبيرة في هذا الإصدار، كما هو موضح أدناه.
  - إصلاح الخلل
    - إصلاح الخطأ الذي يحدث عندما يكون حجم الدفعة أقل من max_batch_size لمجمع gpt pytorch.
    - إصلاح تسرب الذاكرة الذي يحدث كل إعادة توجيه بسبب المُخصص المُعاد استخدامه.
    - إصلاح حالة السباق التي تحدث في نواة عقوبة التكرار.
  - تعزيز
    - إضافة إعداد البذور العشوائية.
    - إصلاح تجاوز سعة المخزن المؤقت لـ GEMM على FP16 لـ GPT.
    - قم بالتغيير لإبطال المخزن المؤقت النهائي لكل إكمال.
    - قم بتقديم stop_before للتوقف المبكر.
- دعم Longformer.
- أعد تسمية layer_para إلى pipeline_para .
- تحسين فرز أخذ العينات أعلى ف.
- دعم التناثر لوحدات معالجة الرسومات Ampere على BERT.
- دعم size_per_head 96، 160، 192، 224، 256 لطراز GPT.
- دعم الاستدلال متعدد العقد للواجهة الخلفية لـ GPT Triton.

يونيو 2021

دعم XLNet

أبريل 2021

الافراج عن FasterTransformer 4.0
- دعم الاستدلال متعدد وحدات معالجة الرسومات والعقد المتعددة لنموذج GPT على C++ وPyTorch.
- دعم عقدة واحدة، واستدلال متعدد وحدات معالجة الرسومات لنموذج GPT على تريتون.
- قم بإضافة نواة الاهتمام متعددة الرؤوس المدمجة int8 لـ bert.
- أضف نواة الاهتمام متعددة الرؤوس FP16 المدمجة لـ V100 لـ bert.
- تحسين نواة وحدة فك التشفير.
- الانتقال إلى الريبو المستقل.
- تم إهمال ملحق PyTorch في وضع Eager.

ديسمبر 2020

الافراج عن FasterTransformer 3.1
- قم بتحسين عملية فك التشفير عن طريق إضافة قناع Finisehd لمنع الحوسبة عديمة الفائدة.
- دعم التشفير opennmt.
- قم بإزالة دعم البرنامج المساعد TensorRT.
- تم إهمال عملية TorchScript المخصصة.

نوفمبر 2020

تحسين الاستدلال INT8.
دعم استنتاج PyTorch INT8.
توفير أدوات القياس الكمي PyTorch INT8.
قم بدمج نواة الانتباه متعددة الرؤوس المدمجة من TensorRT في FasterTransformer.
إضافة اختبار وحدة SQuAD.
قم بتحديث نقاط تفتيش NGC الفائتة.

سبتمبر 2020

دعم جي بي تي 2
الافراج عن FasterTransformer 3.0
- دعم تكميم INT8 لتشفير cpp و TensorFlow op.
- إضافة أداة bert-tf-quantization.
- أصلح مشكلة فشل Cmake 15 أو Cmake 16 في إنشاء هذا المشروع.

أغسطس 2020

إصلاح الخلل في البرنامج المساعد TRT.

يونيو 2020

الافراج عن FasterTransformer 2.1
- إضافة برنامج FasterTransformer الفعال بناءً على فكرة فكرة المحول الفعال.
- تحسين حبات البحث الشعاعية.
- أضف دعم PyTorch op

مايو 2020

أصلح الخلل المتمثل في أن seq_len لبرنامج التشفير يجب أن يكون أكبر من 3.
أضف موضع_تشفير فك التشفير كمدخل لفك تشفير FasterTransformer. يعد هذا مناسبًا لاستخدام أنواع مختلفة من ترميز الموضع. لا يقوم FasterTransformer بحساب قيمة ترميز الموضع، ولكنه يبحث فقط في الجدول.
تعديل طريقة تحميل النموذج في translate_sample.py .

أبريل 2020

أعد تسمية decoding_opennmt.h إلى decoding_beamsearch.h
أضف DiverseSiblingsSearch لفك التشفير.
إضافة أخذ العينات إلى فك التشفير
- يتم التنفيذ في decoding_sampling.h
- أضف عينات top_k وأخذ عينات top_p لفك التشفير.
قم بإعادة بناء رموز العمليات المخصصة لـ Tensorflow.
- قم بدمج bert_transformer_op.h و bert_transformer_op.cu.cc في bert_transformer_op.cc
- دمج decoder.h و decoder.cu.cc في decoder.cc
- دمج decoding_beamsearch.h و decoding_beamsearch.cu.cc في decoding_beamsearch.cc
إصلاح الخلل في وظيفة إنهاء decoding.py.
إصلاح الخلل في tf DiverseSiblingSearch.
أضف BLEU Scorer bleu_score.py إلى utils . لاحظ أن نتيجة BLEU تتطلب python3.
فتيل QKV جوهرة التشفير وmasked_multi_head_attention لوحدة فك التشفير.
أضف حجم الدفعة الديناميكي وميزات طول التسلسل الديناميكي إلى جميع العمليات.

مارس 2020

إضافة ميزة في FasterTransformer 2.0
- أضف translate_sample.py لتوضيح كيفية ترجمة جملة من خلال استعادة نموذج OpenNMT-tf المُدرب مسبقًا.
إصلاح أخطاء Fastertransformer 2.0
- إصلاح الخلل المتمثل في أن الحد الأقصى لطول التسلسل لجهاز فك التشفير لا يمكن أن يكون أكبر من 128.
- إصلاح الخلل الذي لا يتحقق من فك التشفير بعد كل خطوة.
- إصلاح الخلل في وحدة فك التشفير حول max_seq_len.
- قم بتعديل بنية نموذج فك التشفير لتناسب نموذج فك تشفير OpenNMT-tf.
  - أضف طبقة تطبيع الطبقة بعد وحدة فك التشفير.
  - إضافة تطبيع لمدخلات وحدة فك التشفير

فبراير 2020

الافراج عن FasterTransformer 2.0
- توفير وحدة فك تشفير وفك تشفير مبنية على OpenNMT-tf، بما في ذلك C++ API وTensorFlow op.
- قم بتحسين نماذج الرموز الخاصة ببرنامج التشفير.
- أضف ميزة حجم الدفعة الديناميكية إلى عملية التشفير.

يوليو 2019

الافراج عن FasterTransformer 1.0
- توفير طبقة محولات مكافئة محسنة للغاية، بما في ذلك C++ API وTensorFlow op وTensorRT plugin.

القضايا المعروفة

لا يمكن الترجمة على Tensorflow 2.10 بسبب مشكلة رمز غير محددة.
أخطاء رمز غير محددة عند استيراد الامتداد
- يرجى import torch أولا. إذا حدث ذلك، فهذا يرجع إلى عدم توافق C++ ABI. قد تحتاج إلى التحقق من أن PyTorch المستخدم أثناء التجميع والتنفيذ هو نفسه، أو تحتاج إلى التحقق من كيفية تجميع PyTorch الخاص بك، أو إصدار مجلس التعاون الخليجي الخاص بك، وما إلى ذلك.
ستكون نتائج TensorFlow وOP مختلفة في فك التشفير. سبب هذه المشكلة هو احتمالية السجل المتراكم، ونحن لا نتجنب هذه المشكلة.
إذا واجهت بعض المشاكل في البيئة المخصصة، فحاول استخدام gcc/g++ 4.8 لبناء مشروع TensorFlow op، خاصة لـ TensorFlow 1.14.

يوسع

معلومات إضافية

الإصدار v5.3 release
النوع كود الذكاء الاصطناعي
وقت التحديث 2024-12-08
الحجم 25.45MB
من Github

تطبيقات ذات صلة

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
node telegram bot api

كود الذكاء الاصطناعي

v0.50.0
typebot.io

كود الذكاء الاصطناعي

v3.1.2
python wechaty getting started

كود الذكاء الاصطناعي

1.0.0
waymo open dataset

شفرة المصدر الأخرى

December 2023 Update
termwind

فئات أخرى

v2.3.0
wp functions

فئات أخرى

1.0.0

أخبار ذات صلة الكل