หน้าโครงการ | arxiv
แบบจำลองภาษาขนาดใหญ่ (LLMS) มีความก้าวหน้าที่น่าประทับใจในการประมวลผลภาษาธรรมชาติ แบบจำลองเหล่านี้ขึ้นอยู่กับคำแนะนำของมนุษย์ที่เหมาะสม (หรือพรอมต์) เพื่อสร้างการตอบสนองที่เหมาะสม อย่างไรก็ตามศักยภาพของ LLM ไม่ได้ถูกควบคุมอย่างเต็มที่โดยวิธีการแจ้งเตือนที่ใช้กันทั่วไป:
เราเสนอ Evoke ซึ่ง เป็นกรอบการปรับแต่งอัตโนมัติ ใน Evoke มีสองอินสแตนซ์ของ LLM เดียวกัน: a) หนึ่งในฐานะผู้ตรวจสอบ (LLM-Reviewer) มันให้คะแนนพรอมต์ปัจจุบัน; b) อีกคนในฐานะผู้เขียน (LLM-Author) มันแก้ไขพรอมต์โดยพิจารณาจากประวัติการแก้ไขและความคิดเห็นของผู้ตรวจสอบ
ลูปข้อเสนอแนะผู้เขียนตรวจสอบดังกล่าวทำให้มั่นใจได้ว่าพรอมต์จะได้รับการปรับปรุงในการทำซ้ำแต่ละครั้ง เรารวมวิธีการเลือกข้อมูลเพื่อทำให้เกิดขึ้นโดยมีเพียงตัวอย่างที่ยากเท่านั้นที่สัมผัสกับ LLM ตัวอย่างที่ยากมีความสำคัญมากกว่าเนื่องจาก LLM สามารถพัฒนาความเข้าใจที่ลึกซึ้งยิ่งขึ้นของงานออกมาจากพวกเขาในขณะที่โมเดลอาจรู้วิธีแก้ปัญหาที่ง่ายขึ้นแล้ว ผลการทดลองแสดงให้เห็นว่าทำให้เกิดผลดีกว่าวิธีการที่มีอยู่อย่างมีนัยสำคัญ
รายละเอียดเพิ่มเติมเร็ว ๆ นี้ รวมถึงสนามเด็กเล่น!
โครงการนี้ยินดีต้อนรับการมีส่วนร่วมและข้อเสนอแนะ การมีส่วนร่วมส่วนใหญ่กำหนดให้คุณต้องยอมรับข้อตกลงใบอนุญาตผู้มีส่วนร่วม (CLA) ประกาศว่าคุณมีสิทธิ์และทำจริงให้สิทธิ์ในการใช้การบริจาคของคุณ สำหรับรายละเอียดเยี่ยมชม https://cla.opensource.microsoft.com
เมื่อคุณส่งคำขอดึง CLA บอทจะพิจารณาโดยอัตโนมัติว่าคุณจำเป็นต้องให้ CLA และตกแต่ง PR อย่างเหมาะสม (เช่นการตรวจสอบสถานะแสดงความคิดเห็น) เพียงทำตามคำแนะนำที่จัดทำโดยบอท คุณจะต้องทำสิ่งนี้เพียงครั้งเดียวใน repos ทั้งหมดโดยใช้ CLA ของเรา
โครงการนี้ได้นำรหัสการดำเนินงานของ Microsoft โอเพ่นซอร์สมาใช้ สำหรับข้อมูลเพิ่มเติมโปรดดูจรรยาบรรณคำถามที่พบบ่อยหรือติดต่อ [email protected] พร้อมคำถามหรือความคิดเห็นเพิ่มเติมใด ๆ
โครงการนี้อาจมีเครื่องหมายการค้าหรือโลโก้สำหรับโครงการผลิตภัณฑ์หรือบริการ การใช้เครื่องหมายการค้าหรือโลโก้ของ Microsoft ที่ได้รับอนุญาตขึ้นอยู่กับและต้องปฏิบัติตามแนวทางเครื่องหมายการค้าและแบรนด์ของ Microsoft การใช้เครื่องหมายการค้าหรือโลโก้ของ Microsoft ในรุ่นที่แก้ไขของโครงการนี้จะต้องไม่ทำให้เกิดความสับสนหรือบอกเป็นสปอนเซอร์ของ Microsoft การใช้เครื่องหมายการค้าหรือโลโก้ของบุคคลที่สามจะอยู่ภายใต้นโยบายของบุคคลที่สามเหล่านั้น