يحتوي المستودع على تعليمات برمجية لإنشاء قصائد قصيرة باستخدام نماذج اللغة التوليدية ذات بنية GPT.
يتم استخدام نموذج لغة تحويلية يعتمد على بنية GPT. ويأخذ هذا النموذج بعين الاعتبار كلاً من قواعد اللغة الروسية (على غرار نماذج لغوية مثل الرغبت) وصوتياتها، بما في ذلك قواعد القافية وبناء الوزن الشعري. التفاصيل في العرض.
الثنائيات النموذجية متوفرة في inkoziev/verslibre:latest docker image.
تنزيل الصورة وتشغيلها:
sudo docker pull inkoziev/verslibre:latest
sudo docker run -it inkoziev/verslibre:latest
بعد الإطلاق، سيطلب منك البرنامج إدخال رمز مميز لبوت التليجرام.
بعد تحميل جميع النماذج، يمكنك بدء تشغيل الروبوت في الدردشة باستخدام الأمر /start. سيطلب منك الروبوت اختيار واحد من ثلاثة مواضيع عشوائية لمقالتك أو إدخال الموضوع الخاص بك. يمكن أن يكون الموضوع أي عبارة تحتوي على اسم في الدور الرئيسي، على سبيل المثال "مولد القصيدة".
هذا الروبوت متاح في برقية باسم @verslibre_bot
أمثلة الجيل:
* * *
Любовь - источник вдохновения,
Души непризнанных людей.
И день весеннего цветения,
Омытый зеленью дождей…
* * *
Душа, гонимая страстями,
Тревожит, веет теплотой.
Любовь, хранимая стихами,
И примиренье, и покой.
بالإضافة إلى النموذج التوليدي نفسه، فإن الناسخ الشعري، الذي يمثل مصدر القصائد لنماذج التدريب، له أهمية كبيرة للتشغيل السليم. يمكنك قراءة المزيد عن عمل الناسخ هنا.
صورة عامل الإرساء inkoziev/haiku: الأحدث متاحة لتشغيل المولد كروبوت برقية.
قم بتنزيل الصورة وتشغيلها:
sudo docker pull inkoziev/haiku:latest
sudo docker run -it inkoziev/haiku
سيطلب منك البرنامج إدخال رمز بوت برقية. سيتم بعد ذلك تحميل النماذج (حوالي دقيقة واحدة) ويمكنك التواصل مع الروبوت. أدخل بذرة - اسم أو عبارة. يستغرق إنشاء العديد من الخيارات على وحدة المعالجة المركزية حوالي 30 ثانية. بعد ذلك سيعرض الروبوت الخيار الأول ويعرض عليك تقييمه، أو يعرض الخيار التالي.
هذا البوت متاح في التليجرام باسم @haiku_guru_bot.
وبما أن هذا نموذج توليدي عشوائي، فلا يمكن عادةً تكرار نتائجه بمجرد إدخال نفس البذرة. انسخ النتائج الجيدة وأكملها بنموذج توضيحي، مثل ruDALLE، واحصل على محتوى فريد تمامًا:
يمكن رؤية المزيد من الأمثلة على الهايكو على مدونتي.
يحتوي الدليل الفرعي tmp على ملفات تحتوي على جزء من بيانات التدريب:
Poetry_corpus.txt - مجموعة الرباعيات المفلترة، الرمز | كفاصل خطي؛ تستخدم للتدريب الإضافي لنموذج ruGPT.
Poem_generator_dataset.dat - مجموعة بيانات للتدريب على ruGPT، والتي تنتج نص قصيدة حسب الموضوع (العبارة الرئيسية).
captions_generator_rugpt.dat - مجموعة بيانات لتدريب ruGPT، وإنشاء عنوان بيت شعر بناءً على محتواه.
يمكن العثور على وصف لعملية إعداد هيئة التدريب هنا.