مستودع تجارب الأطروحة: إنشاء حالات الاختبار من قصص المستخدمين باستخدام الذكاء الاصطناعي التوليدي
ملخص
هذا المستودع هو جزء من رسالة الماجستير الخاصة بي. أطروحة بعنوان "إنشاء حالة اختبار من قصص المستخدمين في هندسة المتطلبات باستخدام تقنيات الذكاء الاصطناعي التوليدي مع نماذج LLM: تحليل مقارن." يستكشف البحث تطبيق نماذج اللغات الكبيرة (LLMs) في أتمتة إنشاء حالات الاختبار من قصص المستخدم ضمن هندسة متطلبات البرمجيات. من خلال مقارنة تقنيات الذكاء الاصطناعي التوليدي المختلفة ونماذج ماجستير إدارة الأعمال، تهدف الأطروحة إلى تحديد النهج الأكثر فعالية لتحسين دقة واكتمال وكفاءة إنشاء حالات الاختبار.
فكرة الأطروحة
الفكرة الأساسية وراء هذه الأطروحة هي الاستفادة من تقنيات الذكاء الاصطناعي التوليدي المتقدمة وLLMs لأتمتة العملية اليدوية التقليدية والمستهلكة للوقت لتوليد حالات الاختبار من قصص المستخدمين. تُعد قصص المستخدمين، المكتوبة عادةً باللغة الطبيعية، جزءًا لا يتجزأ من عملية تطوير برمجيات Agile، وتعمل كمصدر لاستخلاص حالات الاختبار التي تتحقق من صحة وظائف ميزات البرنامج. تبحث الأطروحة في تقنيات تحفيز متعددة ونماذج LLM لتقييم قدرتها على إنشاء حالات اختبار ذات صلة وشاملة، مما يوفر في النهاية نظرة ثاقبة حول أفضل الممارسات لدمج الذكاء الاصطناعي في سير عمل هندسة المتطلبات.
هيكل المستودع
تم تصميم هذا المستودع لتوفير عرض تفصيلي ومنظمة للتجارب التي تم إجراؤها كجزء من بحث الأطروحة. يتوافق كل مجلد داخل المستودع مع تجربة معينة أو مجموعة من التجارب ويتضمن المكونات التالية:
1. حالات الاختبار التي تم إنشاؤها (PDF)
- المحتوى : يحتوي كل مجلد تجربة على مستند PDF يحتوي على حالات الاختبار التي تم إنشاؤها بواسطة نماذج LLM المحددة وتقنيات المطالبة. تعتبر حالات الاختبار هذه ضرورية لتقييم النماذج بناءً على دقتها واكتمالها وصلتها بقصص المستخدم المقدمة.
- الغرض : تعمل ملفات PDF كمخرج ملموس للتجارب، مما يوضح التطبيق العملي للنماذج في إنشاء حالات الاختبار.
2. أوراق Excel مع المقاييس التفصيلية
- المحتوى : يرافق كل تجربة ملف Excel يوثق جميع المقاييس والنتائج الرئيسية المحسوبة أثناء التجربة. يتضمن ذلك عدد عينات البيانات المدخلة، ودرجات الدقة، ودرجات الاكتمال، ومؤشرات الأداء الأخرى.
- الغرض : توفر أوراق Excel تحليلاً شاملاً لكل تجربة، مما يتيح إجراء مقارنات تفصيلية عبر نماذج مختلفة وتقنيات المطالبة.
3. الرسوم البيانية المرئية (مجلد الصور)
- المحتوى : داخل كل مجلد تجربة، يوجد مجلد فرعي "صور" يحتوي على رسوم بيانية ومخططات مرئية توضح نتائج التجارب.
- الغرض : توفر هذه المرئيات فهمًا بديهيًا لاتجاهات الأداء، والمقارنات بين النماذج، والفعالية الشاملة للتقنيات المستخدمة. إنها ضرورية لاستيعاب الأفكار الأساسية بسرعة واستخلاص النتائج من البيانات.
4. كود الأطروحة (مجلد الكود)
- المحتوى : مجلد مخصص يحتوي على كافة التعليمات البرمجية الأصلية المستخدمة أثناء التجارب. يتضمن ذلك البرامج النصية للمعالجة المسبقة للبيانات والمطالبة بالنماذج وإنشاء حالة الاختبار وتحليل الأداء.
- الغرض : يتيح هذا المجلد للمستخدمين استكشاف وتشغيل التعليمات البرمجية التي كانت جزءًا لا يتجزأ من البحث، مما يضمن إمكانية تكرار النتائج وشفافية التجارب.
السياق التجريبي والأهداف
تم تصميم التجارب الموثقة في هذا المستودع لتحقيق عدة أهداف رئيسية ضمن الأطروحة:
- التحليل المقارن : تقييم ومقارنة فعالية نماذج LLM المختلفة وتقنيات المطالبة في توليد حالات اختبار من قصص المستخدمين.
- إطار عمل شجرة الأفكار (ToT) : دمج واختبار إطار عمل شجرة الأفكار (ToT) لتعزيز قدرات التفكير المنطقي لطلاب LLM في إنشاء حالات اختبار أكثر دقة.
- اختبار قابلية التوسع : إجراء تجارب بأحجام مختلفة لبيانات الإدخال (100 و500 عينة) لتقييم قابلية التوسع ومتانة النماذج.
- مقاييس الأداء : تحليل حالات الاختبار التي تم إنشاؤها باستخدام مجموعة من المقاييس، بما في ذلك الدقة والاكتمال والملاءمة، لتحديد النماذج والتقنيات الأفضل أداءً.
كيفية استخدام هذا المستودع
- استكشاف حالات الاختبار التي تم إنشاؤها : انتقل عبر ملفات PDF الموجودة في كل مجلد لمراجعة حالات الاختبار التي تنتجها النماذج والتقنيات المختلفة. هذه الوثائق هي المفتاح لفهم النتائج العملية للبحث.
- تحليل المقاييس : افتح ملفات Excel لاستكشاف المقاييس والنتائج التفصيلية لكل تجربة. توفر هذه الملفات نظرة عميقة على أداء النماذج عبر أبعاد مختلفة.
- تصور النتائج : تحقق من مجلد "الصور" داخل كل دليل تجربة للحصول على تمثيلات مرئية للبيانات. تم تصميم هذه الرسوم البيانية لمساعدة المستخدمين على فهم النتائج بسرعة وتحديد الاتجاهات.
- قم بتشغيل الكود : استكشف مجلد "الكود" لعرض أو تنفيذ البرامج النصية الأصلية المستخدمة لإجراء التجارب. وهذا أمر ضروري للاستنساخ ومزيد من التجارب.
تنصل
يتم توفير محتوى هذا المستودع للأغراض الأكاديمية والبحثية فقط. تعتمد النتائج والاستنتاجات المقدمة على نماذج وتقنيات محددة كما هو مفصل في الأطروحة. في حين تم بذل كل جهد لضمان دقة البيانات والنتائج، قد تحدث اختلافات تبعا لسياق وتطبيق هذه الأساليب. يُنصح المستخدمون بتطبيق المعلومات الواردة في هذا المستودع وفقًا لتقديرهم الخاص وعلى مسؤوليتهم الخاصة.
حقوق الطبع والنشر
© 2024 أكشات ميهتا. جميع الحقوق محفوظة. الاستخدام غير المصرح به للمواد الموجودة في هذا المستودع دون إذن ممنوع منعا باتا.