5/8/2024
: تحديث كود الاستدلال GPT-3.5 وLLama2 ونتائج الشكل 6، الذي يوضح الطبيعة الناشئة للتآزر المعرفي.3/15/2024
: تم قبول هذه الورقة كورقة مؤتمر رئيسية في NAACL2024! pip install -r requirements.txt
config_template.sh
وقم بتشغيل source config_template.sh
لإعداد متغيرات env (لاحظ أننا نستخدم Azure API في تجاربنا) نحن نقدم نصوصًا برمجية قيد التشغيل لكل مهمة من المهام الثلاث، يرجى مراجعة التعليقات في النصوص البرمجية ".sh" لمزيد من المعلومات:
bash scripts/trivia_creative_writing.sh
bash scripts/codenames_collaborative.sh
bash scripts/logic_grid_puzzle.sh
يمكن العثور على جميع المطالبات في مجلد prompts/
.
يمكن العثور على جميع مجموعات البيانات في مجلد data/
.
يمكن العثور على النتائج التجريبية في الورقة الخاصة بكل مهمة في logs/
السجلات. يحتوي gpt4_w_sys_mes
و gpt4_wo_sys_mes
على نتائج مطابقة للجدول 2 في ورقتنا. نقوم أيضًا بتضمين نتائج gpt-3.5 وllama2-13b المطابقة للنتائج الواردة في الشكل 6، حيث تتبع المعلمات الفائقة، مثل إضافة رسالة النظام أم لا، الاختيارات الأفضل أداءً في تجارب gpt4.
"test_output_infos"
: يحتوي على مقاييس التقييم لكل حالة، على سبيل المثال، # الإجابات الصحيحة المذكورة."*raw_responses"
: الاستجابات الأولية من كل استدعاء لواجهة برمجة التطبيقات."*parsing_flag"
: ما إذا كان قد تم تحليل الاستجابة الأولية بنجاح. (بالنسبة لمهمة Codenames، يتم فصل هذا الحقل إلى "parsing_success_flag_spymaster" و"parsing_success_flag_guesser")"unwrapped_output"
: المخرجات التي تم تحليلها والتي سيتم استخدامها لحساب مقاييس التقييم. (بالنسبة لمهمة Codenames، يتم فصل هذا الحقل إلى "spymaster_output" و"guesser_output"؛ ويوجد حقل إضافي يسمى "hint_word" والذي يتم تحليله من مخرجات Spymaster وإدراجه في مدخلات Guesser؛ ويتم حساب مقياس التقييم بناءً على " "تخمين_الإخراج")"task data"
: بيانات لمثيل المهمة الحالية، على سبيل المثال، الأسئلة والإجابات والكلمات المستهدفة، وما إلى ذلك."usage"
: تسجيل عدد الرموز المميزة والتكلفة التي تم إنفاقها حتى الآن.يرجى الاستشهاد بالورقة وتمييز هذا الريبو بنجمة إذا وجدت هذا العمل مثيرًا للاهتمام/مفيدًا.
@article{wang2023unleashing,
title={Unleashing Cognitive Synergy in Large Language Models: A Task-Solving Agent through Multi-Persona Self-Collaboration},
author={Wang, Zhenhailong and Mao, Shaoguang and Wu, Wenshan and Ge, Tao and Wei, Furu and Ji, Heng},
journal={arXiv preprint arXiv:2307.05300},
year={2023}
}
تشير قاعدة التعليمات البرمجية هذه إلى بنية الريبو الرسمي لشجرة الفكر. ونحن نشكر المؤلفين على جهودهم في مجال المصادر المفتوحة.