تنزيل ainovelprompter - تنزيل رمز المصدر ainovelprompter

ainovelprompter

كود الذكاء الاصطناعي

1.0.0

تنزيل

منظمة العفو الدولية رواية

يمكن لـ AI Novel Prompter إنشاء مطالبات كتابة للروايات بناءً على الخصائص المحددة للمستخدم.

أداة القائمة على Wails

AI Novel Prompter هو تطبيق سطح مكتب مصمم لمساعدة الكتاب على إنشاء مطالبات متسقة ومنظمة لمنظمة AI مثل ChatGpt و Claude. تساعد الأداة في إدارة عناصر القصة وتفاصيل الشخصية وإنشاء مطالبات منسقة بشكل صحيح لمواصلة روايتك.

القابلة للتنفيذ على بناء/بن قابلة للتنفيذ

سمات

1. إدارة المهام والفصل

اختيار نوع المهمة : تحديد وتخصيص أنواع مختلفة من مهام الكتابة
نموذج إدارة الفصل : تخزين ومرجع عينة فصول لاتساق النمط
علامات تبويب محتوى الفصل :
- يدق القصة: خطط للنقاط الرئيسية لفصلك التالي
- الفصل السابق: الرجوع إلى آخر فصل مكتوب
- ملاحظات مستقبلية: تتبع التطورات المستقبلية المخطط لها

رواية منظمة العفو الدولية 1

2. إدارة عنصر القصة

يمكن تحرير كل فئة وحفظها وإعادة استخدامها عبر مطالبات مختلفة:

القواعد : تحديد قواعد الكتابة وإرشادات الأسلوب
الشخصيات : إدارة ملفات تعريف الأحرف والتفاصيل
المواقع : تتبع مواقع القصة وأوصافها
المخطوطة : تخزين عناصر بناء العالم والتقاليد

3. جيل موجه

دعم ثنائي ثنائي :
- التنسيق المحسّن
- تنسيق XML المحسّن
معاينة الوقت الفعلي : انظر موجهتك المنسقة أثناء قيامك بإنشائها
العد المميز : تتبع الاستخدام الرمزي لحدود نموذج الذكاء الاصطناعي
التعليمات المخصصة : إضافة متطلبات أو إرشادات محددة

4. استمرار البيانات

يتم حفظ جميع البيانات تلقائيًا محليًا
تشمل الفئات:
- أنواع المهام
- عينة الفصول
- قواعد
- الشخصيات
- المواقع
- إدخالات المخطوطة

5. واجهة المستخدم

تصميم نظيف وحديث : مبني مع مكونات Shadcn/UI
التصميم المستجيب : يتكيف مع أحجام النوافذ المختلفة
الواجهة المتبعة : الوصول إلى المحتوى المنظم
المحررين الوسيطين : تحرير سهولة لعناصر القصة

كومة تقنية

الواجهة الأمامية :
- رد فعل
- TypeScript
- Tailwind CSS
- مكونات Shadcn/UI
الخلفية :
- يذهب
- إطار Wails

إدارة الملفات

يحفظ البيانات في الدليل الرئيسي للمستخدم تحت .ai-novel-prompter
يدعم الملفات حتى 500 كيلو بايت
يتضمن إمكانيات اختيار الملف والمجلد

تثبيت

 # Clone the repository
git clone [repository-url]

# Install frontend dependencies
cd frontend
npm install

# Build and run the application
cd ..
wails dev

بناء للإنتاج

لإنشاء حزمة وضع الإنتاج القابلة لإعادة التوزيع ، استخدم wails build .

wails build

القابلة للتنفيذ على بناء/بن قابلة للتنفيذ

أو توليدها مع:

 wails build -nsis

يمكن القيام بذلك لنظام التشغيل Mac وكذلك شاهد الجزء الأخير من هذا الدليل

سيكون التطبيق المبني متاحًا في دليل build .

دليل الاستخدام

الإعداد الأولي :
- حدد أنواع المهام الخاصة بك (على سبيل المثال ، "اكتب الفصل التالي" ، "مراجعة الفصل")
- أضف عينة فصول للمرجع النمط
- قم بإعداد قواعدك وإرشاداتك
إنشاء موجه :
- حدد نوع مهمتك
- المرجع أو أضف الفصل السابق الخاص بك
- اكتب قصتك تدق
- حدد القواعد والأحرف والمواقع ذات الصلة
- إضافة أي تعليمات مخصصة
توليد الإخراج :
- اختر بين تنسيق chatgpt أو كلود
- مراجعة المطالبة التي تم إنشاؤها
- نسخ إلى الحافظة
- الصق في مساعدك المفضل لمنظمة العفو الدولية

تطوير

إضافة ميزات جديدة

تدعم قاعدة الشفرة إضافة سهلة للمحددات والخيارات الجديدة
تتبع المكونات الوسيطة نمطًا ثابتًا
يتم التعامل مع استمرار البيانات تلقائيًا

التخصيص

تستخدم جميع المكونات CSS Tailwind للتصميم
يمكن تخصيص مكونات واجهة المستخدم من خلال Shadcn/UI
يمكن تعديل التنسيق السريع في الأداة المساعدة

أداة على الويب

سمات

تسجيل المستخدم والمصادقة
إنشاء النص وإدارته
إنشاء الفصل وإدارته
تقديم التعليقات وإدارتها
جيل موجه على أساس السمات
التكامل مع خدمة Ollama المحلية
بناءً على قالب التوت (https://codedthemes.gitbook.io/berry)
مستوحى على جيسون هاميلتون يوتيوب (https://www.youtube.com/@thenerdynovelist)

التقنيات المستخدمة

الواجهة الأمامية:
- رد فعل
- TypeScript
- البديهية
- رد فعل جهاز التوجيه
- رد فعل توست
الخلفية:
- يذهب
- إطار ويب الجن
- Gorm (Go ORM)
- postgresql

المتطلبات الأساسية

قبل تشغيل التطبيق ، تأكد من تثبيت ما يلي:

node.js (v18 أو أعلى)
اذهب (v1.18 أو أعلى)
postgresql
عامل ميناء
Docker Compose

ابدء

استنساخ المستودع:

 git clone https://github.com/danielsobrado/ainovelprompter.git

انتقل إلى دليل المشروع:
```
 cd ainovelprompter
```
قم بإعداد الواجهة الخلفية:

انتقل إلى دليل server :
```
 cd server
```
تثبيت تبعيات GO:
```
 go mod download
```
قم بتحديث ملف config.yaml بتكوين قاعدة البيانات الخاصة بك.
قم بتشغيل ترحيل قاعدة البيانات:
```
 go run cmd/main.go migrate
```
ابدأ خادم الواجهة الخلفية:
```
 go run cmd/main.go
```

قم بإعداد الواجهة الأمامية:

انتقل إلى دليل client :
```
 cd ../client
```
تثبيت تبعيات الواجهة الأمامية:
```
 npm install
```
ابدأ خادم تطوير الواجهة الأمامية:
```
 npm start
```

افتح متصفح الويب الخاص بك وقم بزيارة http://localhost:3000 للوصول إلى التطبيق.

البدء (Docker)

استنساخ المستودع:

 git clone https://github.com/danielsobrado/ainovelprompter.git

انتقل إلى دليل المشروع:

 cd ainovelprompter

قم بتحديث ملف docker-compose.yml بتكوين قاعدة البيانات الخاصة بك.
ابدأ التطبيق باستخدام Docker Compose:

 docker-compose up -d

افتح متصفح الويب الخاص بك وقم بزيارة http://localhost:3000 للوصول إلى التطبيق.

إعدادات

يمكن تعديل تكوين الواجهة الخلفية في ملف server/config.yaml .
يمكن تعديل تكوين الواجهة الأمامية في ملف client/src/config.ts .

يبني

لبناء الواجهة الأمامية للإنتاج ، قم بتشغيل الأمر التالي في دليل client :

 npm run build

سيتم إنشاء ملفات جاهزة للإنتاج في دليل client/build .

دليل التثبيت والإدارة لـ PostgreSQL على WSL

يوفر هذا الدليل الصغير إرشادات حول كيفية تثبيت postgreSQL على النظام الفرعي لـ Windows لـ Linux (WSL) ، إلى جانب خطوات لإدارة أذونات المستخدم واستكشاف المشكلات الشائعة.

المتطلبات الأساسية

Windows 10 أو أعلى مع تمكين WSL. (أو فقط أوبونتو)
الألفة الأساسية مع سطر أوامر Linux و SQL.

تثبيت

Open WSL Terminal : قم بتشغيل توزيع WSL الخاص بك (الموصى به Ubuntu).
تحديث الحزم :
```
sudo apt update
```

تثبيت postgresql :

sudo apt install postgresql postgresql-contrib

تحقق من التثبيت :
```
psql --version
```
اضبط كلمة مرور المستخدم postgresql :
```
sudo passwd postgres
```

عمليات قاعدة البيانات

إنشاء قاعدة بيانات :
```
createdb mydb
```
قاعدة بيانات الوصول :
```
psql mydb
```

استيراد الجداول من ملف SQL :

psql -U postgres -q mydb < /path/to/file.sql

قائمة قواعد البيانات والجداول :

l  # List databases
dt # List tables in the current database

تبديل قاعدة البيانات :
```
c dbname
```

إدارة المستخدم

إنشاء مستخدم جديد :

 CREATE USER your_db_user WITH PASSWORD ' your_db_password ' ;

امتيازات المنح :
```
 ALTER USER your_db_user CREATEDB;
```

استكشاف الأخطاء وإصلاحها

الدور غير موجود خطأ : التبديل إلى مستخدم "postgres":
```
sudo -i -u postgres
createdb your_db_name
```
تم رفض الإذن بإنشاء تمديد : تسجيل الدخول كـ "postgres" وتنفيذ:
```
CREATE EXTENSION IF NOT EXISTS pg_trgm;
```
خطأ غير معروف للمستخدم : تأكد من أنك تستخدم مستخدم نظام معترف به أو الرجوع بشكل صحيح إلى مستخدم postgresql داخل بيئة SQL ، وليس عبر sudo .

توليد بيانات تدريب مخصصة لضبط نموذج اللغة (الخطوات اليدوية)

لإنشاء بيانات تدريب مخصصة لضبط نموذج اللغة لمحاكاة أسلوب الكتابة لجورج ماكدونالد ، تبدأ العملية بالحصول على النص الكامل لأحد رواياته ، "The Princess and the Goblin" ، من Project Gutenberg. ثم يتم تقسيم النص إلى دقات قصة فردية أو لحظات رئيسية باستخدام مطالبة ترشد الذكاء الاصطناعي لإنشاء كائن JSON لكل إيقاع ، والتقاط المؤلف ، والنغمة العاطفية ، ونوع الكتابة ، والمقتطفات النصية الفعلية.

بعد ذلك ، يتم استخدام GPT-4 لإعادة كتابة كل من هذه القصة في كلماتها الخاصة ، مما يولد مجموعة موازية من بيانات JSON مع معرفات فريدة تربط كل إيقاع معاد كتابته إلى نظيره الأصلي. لتبسيط البيانات وجعلها أكثر فائدة للتدريب ، يتم تعيين مجموعة واسعة من النغمات العاطفية إلى مجموعة أصغر من النغمات الأساسية باستخدام وظيفة Python. ثم يتم استخدام ملفين JSON (الإيقاعات الأصلية وإعادة الكتابة) لإنشاء مطالبات تدريب ، حيث يُطلب من النموذج إعادة صياغة النص الذي تم إنشاؤه GPT-4 بأسلوب المؤلف الأصلي. أخيرًا ، يتم تنسيق هذه المطالبات ومخرجاتها المستهدفة في ملفات JSONL و JSON ، وهي جاهزة لاستخدامها في صياغة نموذج اللغة لالتقاط أسلوب الكتابة المميز لـ MacDonald.

توليد بيانات تدريب مخصصة لضبط نموذج اللغة (الآلي)

في المثال السابق ، تضمنت عملية توليد النص المعاد صياغتها باستخدام نموذج لغة بعض المهام اليدوية. كان على المستخدم توفير نص الإدخال يدويًا ، وتشغيل البرنامج النصي ، ثم مراجعة الإخراج الذي تم إنشاؤه لضمان جودته. إذا لم يستوفي الإخراج المعايير المطلوبة ، فسيحتاج المستخدم إلى إعادة إعادة عملية التوليد يدويًا بمعلمات مختلفة أو إجراء تعديلات على نص الإدخال.

ومع ذلك ، مع الإصدار المحدث من وظيفة process_text_file ، كانت العملية بأكملها مؤتمتة بالكامل. تهتم الوظيفة بقراءة الملف النصي للإدخال ، وتقسيمه إلى فقرات ، وإرسال كل فقرة تلقائيًا إلى نموذج اللغة لإعادة الصياغة. إنه يشتمل على مختلف عمليات الفحص وآليات إعادة المحاولة للتعامل مع الحالات التي لا يفي فيها الإخراج الذي تم إنشاؤه بالمعايير المحددة ، مثل احتواء العبارات غير المرغوب فيها ، أو كونها قصيرة جدًا أو طويلة جدًا ، أو تتكون من فقرات متعددة.

تتضمن عملية الأتمتة العديد من الميزات الرئيسية:

استئنافًا من الفقرة الأخيرة التي تمت معالجتها: إذا تم مقاطعة البرنامج النصي أو يحتاج إلى تشغيل عدة مرات ، فإنه يتحقق تلقائيًا من ملف الإخراج ويستأنف المعالجة من الفقرة الأخيرة التي نجحت. هذا يضمن عدم فقد التقدم ويمكن أن يلتقط البرنامج النصي من حيث توقف.
آلية إعادة المحاولة مع البذور العشوائية ودرجة الحرارة: إذا فشلت إعادة صياغة تم إنشاؤها في تلبية المعايير المحددة ، فإن البرنامج النصي يعيد تلقائيًا عملية التوليد إلى عدد محدد من المرات. مع كل إعادة المحاولة ، يغير بشكل عشوائي قيم البذور ودرجة الحرارة لإدخال التباين في الاستجابات التي تم إنشاؤها ، مما يزيد من فرص الحصول على ناتج مرضي.
حفظ التقدم: يحفظ البرنامج النصي التقدم إلى ملف الإخراج كل عدد محدد من الفقرات (على سبيل المثال ، كل 500 فقرات). هذه الحماية من فقدان البيانات في حالة وجود أي انقطاع أو أخطاء أثناء معالجة ملف نصي كبير.
التسجيل التفصيلي والملخص: يوفر البرنامج النصي معلومات تسجيل مفصلة ، بما في ذلك فقرة الإدخال ، والإخراج المولدة ، ومحاولات إعادة المحاولة ، وأسباب الفشل. كما أنه يولد ملخصًا في النهاية ، حيث يعرض العدد الإجمالي للفقرات ، والفقرات التي تم تجديدها بنجاح ، وفقرات تخطيت ، وإجمالي العدد من إعادة المحاولة.

توليد بيانات تدريب مخصصة لضبط نموذج اللغة مع استوديو LLM و LM المحلي باستخدام ORPO

لإنشاء بيانات تدريب مخصصة لـ ORPO لصقل نموذج اللغة لمحاكاة أسلوب الكتابة لجورج ماكدونالد.

يجب أن تكون بيانات الإدخال بتنسيق JSONL ، مع كل سطر يحتوي على كائن JSON يتضمن المستثيل والمختار. (من الضبط الدقيق السابق) لاستخدام البرنامج النصي ، تحتاج إلى إعداد عميل Openai باستخدام مفتاح API الخاص بك وتحديد مسارات ملفات الإدخال والإخراج. سيقوم تشغيل البرنامج النصي بمعالجة ملف JSONL وإنشاء ملف CSV مع أعمدة للاستجابة المطالبة والاستجابة المختارة ، واستجابة مرفوضة تم إنشاؤها. يوفر البرنامج النصي التقدم كل 100 خط ويمكن أن يستأنف من حيث توقف إذا توقف. عند الانتهاء ، يوفر ملخصًا لإجمالي الخطوط المعالجة والخطوط المكتوبة والخطوط المتخطئة وتفاصيل إعادة المحاولة.

دروس صقل

جودة مجموعة البيانات: 95 ٪ من النتائج تعتمد على جودة مجموعة البيانات. تعد مجموعة البيانات النظيفة ضرورية لأن بعض البيانات السيئة التي يمكن أن تؤذي النموذج.
مراجعة البيانات اليدوية: يمكن لتنظيف وتقييم مجموعة البيانات تحسين النموذج بشكل كبير. هذه خطوة تستغرق وقتًا طويلاً ولكنها ضرورية لأنه لا يمكن لأي قدر من ضبط المعلمات إصلاح مجموعة بيانات معيبة.
يجب ألا تتحسن معلمات التدريب ولكن منع تدهور النموذج. في مجموعات البيانات القوية ، يجب أن يكون الهدف هو تجنب التداعيات السلبية أثناء توجيه النموذج. لا يوجد معدل التعلم الأمثل.
قيود النماذج وقيود الأجهزة: قد تتيح النماذج الأكبر (33B المعلمات) التمكين بشكل أفضل ولكن تتطلب ما لا يقل عن 48 جيجا بايت VRAM ، مما يجعلها غير عملية لغالبية الإعدادات المنزلية.
تراكم التدرج وحجم الدُفعة: يساعد تراكم التدرج على تقليل التورط من خلال تعزيز التعميم عبر مجموعات البيانات المختلفة ، ولكنه قد يقلل من الجودة بعد بضع دفعات.
يعد حجم مجموعة البيانات أكثر أهمية لضبط نموذج الأساس من النموذج الذي تم ضبطه جيدًا. قد يؤدي التحميل الزائد للنموذج المدفوع جيدًا مع البيانات المفرطة إلى تخفيض صقله السابق.
يبدأ جدول معدل التعلم المثالي بمرحلة الاحماء ، ويحمل ثابتًا لعصر ، ثم يتناقص تدريجياً باستخدام جدول جيب التمام.
رتبة النموذج والتعميم: يؤثر مقدار المعلمات القابلة للتدريب على تفاصيل النموذج وتعميمه. تعميم النماذج ذات الرتبة المنخفضة بشكل أفضل ولكن تفقد التفاصيل.
قابلية تطبيق LORA: ينطبق صقل المعلمة الموفرة للمعلمة (PEFT) على نماذج اللغة الكبيرة (LLMS) وأنظمة مثل الانتشار المستقر (SD) ، مما يدل على تعدد استخداماته.

قضايا Llama 3 في Finetuning اعتبارًا من مايو 2024

ساعد مجتمع Unloth في حل العديد من القضايا مع Llama3 Finetuning. فيما يلي بعض النقاط الرئيسية التي يجب وضعها في الاعتبار:

الرموز المزدوجة BOS : الرموز المزدوجة BOS أثناء العصر الجليدي يمكن أن يكسر الأشياء. Unloth يعمل تلقائيًا على إصلاح هذه المشكلة.
تحويل GGUF : تحويل GGUF مكسور. كن حذرًا من BOS المزدوج واستخدم وحدة المعالجة المركزية بدلاً من GPU للتحويل. يحتوي Unloth على تحويلات GGUF التلقائية المدمجة.
أوزان قاعدة عربات التي تجرها الدواب : بعض أوزان قاعدة Llama 3 (وليس الإرشادات) هي "عربات التي تجرها الدواب" (غير مدربة): <|reserved_special_token_{0->250}|> <|eot_id|> <|start_header_id|> <|end_header_id|> هذا يمكن أن يسبب نتائج NANS و DUGGY. Unloth يصلح هذا تلقائيا.
مطالبة النظام : وفقًا لمجتمع Unloth ، فإن إضافة موجه النظام يجعل من الإقامة في إصدار Enstruct (وربما الإصدار الأساسي) أفضل بكثير.
قضايا القياس : قضايا القياس شائعة. راجع هذه المقارنة التي توضح أنه يمكنك الحصول على أداء جيد مع LLAMA3 ، ولكن استخدام القياس الكمي الخاطئ يمكن أن يضر الأداء. للتأليف ، استخدم bitsandbytes NF4 لتعزيز الدقة. بالنسبة إلى GGUF ، استخدم إصدارات I قدر الإمكان.
نماذج السياق الطويلة : نماذج السياق الطويلة مدربة تدريباً سيئًا. إنهم ببساطة يمتدون الحبل theta ، وأحيانًا بدون أي تدريب ، ثم يتدربون على مجموعة بيانات متسلسلة غريبة لجعلها مجموعة بيانات طويلة. هذا النهج لا يعمل بشكل جيد. كان قياس السياق الطويل الناعم والمستمر أفضل بكثير إذا كان التحجيم من 8K إلى 1M طول السياق.

لحل بعض هذه المشكلات ، استخدم Unloth ل llama3 finetuning.

مقاييس التقييم

عند صياغة نموذج لغة لإعادة الصياغة بأسلوب المؤلف ، من المهم تقييم جودة وفعالية إعادة صياغة تم إنشاؤها.

يمكن استخدام مقاييس التقييم التالية لتقييم أداء النموذج:

Bleu (تقييم ثنائي اللغة):
- يقيس Bleu تداخل N-Gram بين إعادة الصياغة الناتجة والنص المرجعي ، مما يوفر درجة بين 0 و 1.
- لحساب درجات Bleu ، يمكنك استخدام مكتبة sacrebleu في Python.
- مثال الاستخدام: from sacrebleu import corpus_bleu; bleu_score = corpus_bleu(generated_paraphrases, [original_paragraphs])
Rouge (defrendy الموجه نحو الاستدعاء لتقييم gisting):
- يقيس Rouge تداخل n-grams بين إعادة الصياغة الناتجة والنص المرجعي ، مع التركيز على الاستدعاء.
- لحساب درجات Rouge ، يمكنك استخدام مكتبة rouge في Python.
- مثال الاستخدام: from rouge import Rouge; rouge = Rouge(); scores = rouge.get_scores(generated_paraphrases, original_paragraphs)
الحيرة:
- تحدد الحيرة عدم اليقين أو الارتباك للنموذج عند إنشاء النص.
- لحساب الحيرة ، يمكنك استخدام نموذج اللغة الدقيقة نفسه.
- مثال الاستخدام: perplexity = model.perplexity(generated_paraphrases)
تدابير stylometric:
- تدابير stylometric التقاط خصائص نمط الكتابة للمؤلف الهدف.
- لاستخراج ميزات stylometric ، يمكنك استخدام مكتبة stylometry في بيثون.
- مثال الاستخدام: from stylometry import extract_features; features = extract_features(generated_paraphrases)

التكامل مع axolotl

لدمج مقاييس التقييم هذه في خط أنابيب Axolotl ، اتبع هذه الخطوات:

قم بإعداد بيانات التدريب الخاصة بك عن طريق إنشاء مجموعة بيانات من الفقرات من أعمال المؤلف المستهدف وتقسيمها إلى مجموعات التدريب والتحقق من الصحة.
صقل نموذج لغتك باستخدام مجموعة التدريب ، وبعد النهج الذي تمت مناقشته سابقًا.
قم بإنشاء إعادة صياغة للفقرات في مجموعة التحقق من الصحة باستخدام النموذج الذي تم ضبطه.
قم بتنفيذ مقاييس التقييم باستخدام المكتبات المعنية ( sacrebleu و rouge و stylometry ) وحساب الدرجات لكل إعادة صياغة تم إنشاؤها.
إجراء التقييم البشري من خلال جمع التصنيفات والتعليقات من المقيمين البشريين.
قم بتحليل نتائج التقييم لتقييم جودة وأسلوب إعادة صياغة تم إنشاؤها واتخاذ قرارات مستنيرة لتحسين عملية ضبطك.

إليك مثال على كيفية دمج هذه المقاييس في خط أنابيبك:

 from sacrebleu import corpus_bleu
from rouge import Rouge
from stylometry import extract_features

# Fine-tune the model using the training set
fine_tuned_model = train_model ( training_data )

# Generate paraphrases for the validation set
generated_paraphrases = generate_paraphrases ( fine_tuned_model , validation_data )

# Calculate evaluation metrics
bleu_score = corpus_bleu ( generated_paraphrases , [ original_paragraphs ])
rouge = Rouge ()
rouge_scores = rouge . get_scores ( generated_paraphrases , original_paragraphs )
perplexity = fine_tuned_model . perplexity ( generated_paraphrases )
stylometric_features = extract_features ( generated_paraphrases )

# Perform human evaluation
human_scores = collect_human_evaluations ( generated_paraphrases )

# Analyze and interpret the results
analyze_results ( bleu_score , rouge_scores , perplexity , stylometric_features , human_scores )

تذكر تثبيت المكتبات اللازمة (Sacrebleu و Rouge و Stylometry) وتكييف الكود لتناسب تنفيذك في Axolotl أو ما شابه.

مقارنة نموذج كتابة الذكاء الاصطناعي

في هذه التجربة ، استكشفت القدرات والاختلافات بين نماذج الذكاء الاصطناعى المختلفة في إنشاء نص مكون من 1500 كلمة استنادًا إلى مطالبة مفصلة. لقد اختبرت النماذج من https://chat.lmsys.org/ ، chatgpt4 ، كلود 3 opus ، وبعض الطرز المحلية في استوديو LM. قام كل نموذج بإنشاء النص ثلاث مرات لمراقبة التباين في مخرجاته. قمت أيضًا بإنشاء موجه منفصل لتقييم كتابة التكرار الأول من كل نموذج وطلبت ChatGPT 4 و كلود أوبوس 3 تقديم ملاحظات.

من خلال هذه العملية ، لاحظت أن بعض النماذج تظهر تباينًا أعلى بين عمليات الإعدام ، بينما يميل البعض الآخر إلى استخدام صيغة مماثلة. كانت هناك أيضًا اختلافات كبيرة في عدد الكلمات التي تم إنشاؤها وكمية الحوار والأوصاف والفقرات التي ينتجها كل نموذج. كشفت ردود الفعل التقييم أن ChatGPT تقترح نثرًا أكثر "صقلًا" ، بينما يوصي كلود بدرجة أقل من النثر الأرجواني. استنادًا إلى هذه النتائج ، قمت بتجميع قائمة من الوجبات السريعة لدمجها في المطالبة التالية ، مع التركيز على هياكل الجملة المتنوعة ، والأفعال القوية ، والتحولات الفريدة على الزخارف الخيالية ، ونغمة متسقة ، وصوت الراوي المتميز ، وسرعة الانخراط. تقنية أخرى يجب مراعاتها وهي طلب التعليقات ثم إعادة كتابة النص بناءً على تلك التعليقات.

أنا منفتح على التعاون مع الآخرين لمزيد من المطالبات المميزة لكل نموذج واستكشاف قدراتهم في مهام الكتابة الإبداعية.

دفع LLMs الصغيرة

التعليمات المباشرة:
- استخدم الأوامر النظيفة والمحددة والمباشرة.
- تجنب الأنف والعبارات غير الضرورية.
إدارة الصفة:
- كن حذرًا مع الصفات ؛ قد تؤثر على استجابة النموذج بشكل غير لائق.
المحددات والتخفيض:
- استخدم Backticks أو Brackets أو Markdown لفصل أجزاء مميزة من النص.
- تساعد تخفيض التنسيق على بنية وفصل الأقسام بشكل فعال.
التنسيقات المهيكلة:
- الاستفادة من JSON ، Markdown ، HTML ، وما إلى ذلك ، للمدخلات والمخرجات.
- تقيد الإخراج باستخدام مخطط JSON عند الضرورة.
أمثلة قليلة:
- توفير أمثلة قليلة من الطرقات من مختلف المنافذ لتجنب الإضافات.
- استخدم هذه الأمثلة "لتعليم" خطوات النموذج في عملية ما.
سلسلة الأفكار:
- تنفيذ مطالبات سلسلة الفكر لتحسين التفكير والتفاهم الإجرائي.
- تقسيم المهام إلى خطوات وتوجيه النموذج من خلالها.
الوصف قبل الانتهاء:
- تطور النموذج لوصف الكيانات قبل الرد.
- تأكد من أن الوصف لا ينزف في الانتهاء عن غير قصد.
إدارة السياق:
- توفير السياق الأساسي فقط ، تجنب مقالب الفقرة غير المهيكلة.
- توجيه النموذج نحو الإجابة المطلوبة مع سياق كافٍ ولكنه موجز.
الاختبار والتحقق:
- يطالب الاختبار عدة مرات للقبض على مخرجات غير متوقعة.
- استخدم ترتيب الانتهاء من أجل الأهمية والوضوح والتماسك.
استخدم القصص:
- التحكم في الإخراج مع تقنيات سرد القصص.
- على سبيل المثال ، اكتب سرد يتضمن تنسيق الإخراج المطلوب.
GBNF القواعد:
- استكشاف قواعد GBNF لتقييد الناتج النموذج والتحكم فيه.
اقرأ وصقل:
- مراجعة وتحسين المطالبات التي تم إنشاؤها لإزالة العبارات غير الضرورية وضمان الوضوح.

دفع لاما 3 ب 8 ب

النماذج لها تحيزات تنسيق متأصلة. بعض النماذج تفضل الواصلات في القوائم ، والبعض الآخر العلامات النجمية. عند استخدام هذه النماذج ، من المفيد عكس تفضيلاتها للمخرجات المتسقة.

النقاط الرئيسية لـ Llama 3 Prompting:

ميول التنسيق:
- يفضل Llama 3 قوائم بعناوين وعلامات جريئة.
- مثال: عنوان حالة العنوان الجريء
  - سرد العناصر مع النجمة بعد اثنين من الخطوط الجديدة
  - قائمة العناصر مفصولة بخط جديد
  القائمة التالية
  - المزيد من عناصر قائمة
  - إلخ...
أمثلة قليلة:
- يتبع Llama 3 كل من مطالبات النظام وأمثلة قليلة.
- إنه مرن مع أساليب الطالب ولكنه قد يقتبس أمثلة قليلة حرفيًا.
الالتزام السريع للنظام:
- يستجيب Llama 3 جيدًا لمطالبات النظام مع تعليمات مفصلة.
- إن الجمع بين مطالبات النظام وأمثلة قليلة ، يؤدي إلى نتائج أفضل.
نافذة السياق:
- نافذة السياق الحالية صغيرة ، مما يحد من استخدام أمثلة قليلة شاملة.
- يمكن معالجة هذا في التحديثات المستقبلية.
الرقابة:
- يحتوي إصدار الإرشادات على بعض الرقابة ولكنه أقل تقييدًا من الإصدارات السابقة.
ذكاء:
- يؤدي أداءً جيدًا في سلسلة من التفكير المفكر.
- قادرة على الفهم والتكيف مع المدخلات المتنوعة.
تناسق:
- بشكل عام متسقة ولكن قد يقتبس مباشرة أمثلة.
- يمكن أن يتحلل الأداء مع ارتفاع درجات الحرارة.

توصيات الاستخدام:

القوائم والتنسيق:
- استخدم تنسيق القائمة المفضل لدقة أفضل.
- تعليمات صريحة Llama 3 على تنسيقات الإخراج المطلوبة إذا كانت مختلفة عن الافتراضي.
إعدادات الدردشة:
- مناسبة للمهام التي تتطلب الذكاء والتعليم التالي.
- يقتصر على نافذة السياق للمهام الكبيرة.
إعدادات خط الأنابيب:
- فعالة لخطوط أنابيب نمط GPT-4 باستخدام مطالبات النظام.
- تقيد قيود نافذة السياق بعض المهام.

Llama 3 مرن وذكي ولكن لديه سياق وتقتبس القيود. ضبط طرق الطالب وفقا لذلك.