ملخص
هذا البرنامج عبارة عن مولد قصائد غنائية يعتمد على تايلور سويفت، حيث يجمع ملفات البيانات من مصادر متعددة، ويعالجها، ثم يستخدم سلسلة ماركوف لإنشاء قصيدة. يستخدم البرنامج مكتبات متنوعة بما في ذلك Pandas وNLTK للتعامل مع معالجة البيانات ومعالجة النصوص ومعالجة اللغة الطبيعية.
متطلبات النظام
متطلبات البرمجيات
- بايثون (3.8 أو أحدث).
- النقطة: مثبت الحزمة لبيثون.
تثبيت الحزم المطلوبة
يمكنك تثبيت الحزم المطلوبة باستخدام النقطة. قم بتشغيل الأمر التالي في المحطة الطرفية أو موجه الأوامر:
pip install numpy pandas nltk
تثبيت
- تأكد من تثبيت Python 3.8 أو إصدار أحدث على نظامك.
- تأكد من تثبيت النقطة على نظامك.
- قم بتنزيل الكود أو استنساخ المستودع على جهازك المحلي.
- تأكد من أن لديك المجلدات التي تحتوي على البيانات النصية ("Data"، "Midnights"، "TheVault").
- انتقل إلى الدليل الذي يحتوي على الرمز الموجود في الجهاز الطرفي أو موجه الأوامر.
- قم بتشغيل الأمر pip المذكور أعلاه لتثبيت الحزم المطلوبة.
- قم بتنزيل بيانات NLTK الضرورية عن طريق تشغيل أوامر Python التالية:
nltk.download('brown')
nltk.download('words')
nltk.download('cmudict')
تشغيل المولد
لتشغيل البرنامج اتبع الخطوات التالية:
- تأكد من تعيين دليل العمل الخاص بك على الدليل الذي يحتوي على الكود.
- تأكد من أن لديك ملفات البيانات الخاصة بك بالتنسيق المطلوب وفي الدلائل الصحيحة. يتوقع البرنامج ملفات CSV تحتوي على كلمات الأغاني في مجلد "Data"، وملفات نصية في مجلدي "Midnights" و"TheVault".
- قم بتشغيل البرنامج باستخدام الأمر التالي في المحطة الطرفية أو موجه الأوامر:
- سيقوم البرنامج بإخراج قصيدة ولدت.
ملفات البيانات
الدلائل
- يتوقع البرنامج ملفات CSV تحتوي على كلمات الأغاني في دليل "البيانات".
- يتوقع البرنامج وجود ملفات نصية لألبوم Midnights في دليل "Midnights".
- يتوقع البرنامج وجود ملفات نصية لمسارات الخزنة في دليل "TheVault".
- يتم تخزين مسارات الدليل لملفات البيانات في المتغيرات. لتغيير المسار يمكنك تعديل ما يلي:
data_path = "Data"
midnights_path = "Midnights"
vault_path = "TheVault"
- تأكد من ترميز الملفات النصية وملفات CSV بتنسيق UTF-8 لتجنب مشكلات التشفير.
مصدر البيانات
- تم استرجاع ملفات CSV الموجودة في دليل البيانات من مجموعة بيانات Kaggle "Taylor Swift Song Lyrics (All Albums)" بواسطة Jan Llenzl Dagohoy. يمكن العثور على مجموعة البيانات هذه على: https://www.kaggle.com/datasets/thespacefreak/taylor-swift-song-lyrics-all-albums
- جميع الكلمات هي كلمات من تايلور سويفت.