ดาวน์โหลด UltraChat - ดาวน์โหลดซอร์สโค้ด UltraChat

UltraChat

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

ข้อมูลและแบบจำลองการสนทนาหลายรอบขนาดใหญ่ ให้ข้อมูล และหลากหลาย

UltraLM • Data Explorer • Nomic AI Atlas Explorer • การเปิดเผยข้อมูล • กระบวนการก่อสร้าง • กระดาษ

ข่าว

❗️❗️ 26 กันยายน 2023: เปิดตัวชุดข้อมูลการตั้งค่าที่หลากหลายและละเอียดขนาดใหญ่ UltraFeedback, โมเดลภาษาใหม่ UltraLM-13B-v2.0, โมเดลรางวัล UltraRM และโมเดลนักวิจารณ์ UltraCM
❗️❗️ด้วย UltraRM การสุ่มตัวอย่างธรรมดาที่ดีที่สุดจาก 16 รายการบรรลุอัตราการชนะ 92.30% (UltraLM2, ? ในผลลัพธ์ 13B) และ 91.54% (UltraLM, ? ในผลลัพธ์ LLaMA-1) อัตราการชนะ เทียบกับ text-davinci-003 บนเกณฑ์มาตรฐาน AlpacaEval
7 สิงหาคม 2566: เปิดตัว UltraLM-65B เวอร์ชันแรก
28 มิถุนายน 2023: UltraLM-13B อยู่ในอันดับที่ 1 ในบรรดาโมเดลโอเพ่นซอร์สบนกระดานผู้นำ AlpacaEval!
27 มิถุนายน 2023: เราเปิดตัว UltraLM-13B เวอร์ชันแรก ซึ่งเป็นโมเดลภาษาแชทอันทรงพลังที่ได้รับการฝึกบน UltraChat!
20 เมษายน 2023: เผยแพร่ข้อมูลทั้งหมด คาดว่าจะมีการประมวลผลมากขึ้นและข้อมูลเพิ่มเติม
17 เมษายน 2023: ภาคการเขียนและการสร้างสรรค์ส่วนที่เหลือได้รับการเผยแพร่ (457k)
12 เมษายน 2023: ส่วนแรกของภาคการเขียนและการสร้างสรรค์ได้รับการเผยแพร่
9 เมษายน 2023: สนับสนุนโดย gpt4all ขณะนี้เรามี Atlas explorer ด้วยเช่นกัน
8 เมษายน 2023: เราเผยแพร่สคริปต์การฝึกอบรมโดยใช้ GPT-J เป็นตัวอย่าง
7 เมษายน 2023: ส่วนที่สองของ Questions about the World เปิดตัว ประกอบด้วยบทสนทนาหลายรอบที่สร้างขึ้น 290,000 รายการ
31 มีนาคม 2023: ส่วนแรกของ Questions about the World เปิดตัว ประกอบด้วยบทสนทนาหลายรอบที่สร้างขึ้น 280,000 รายการ

อัลตร้าแอลเอ็ม

UltraLM คือชุดโมเดลภาษาแชทที่ได้รับการฝึกบน UltraChat ปัจจุบัน เราได้เปิดตัวเวอร์ชัน 13B ซึ่ง ครองอันดับ #1 ในบรรดาโมเดลโอเพ่นซอร์ส และ อันดับที่ 4 ในบรรดาโมเดลทั้งหมดบนกระดานผู้นำ AlpacaEval (28 มิถุนายน 2023) UltraLM-13B ขึ้นอยู่กับ LLaMA-13B และได้รับการสนับสนุนจาก BMTrain ในกระบวนการฝึกอบรม

ดาวน์โหลด

แบบอย่าง	ลิงค์	เวอร์ชัน
อัลตร้าLM-13B	ฮักกิ้งเฟซ รีโป	เวอร์ชัน 1.0
อัลตร้าLM-65B	ฮักกิ้งเฟซ รีโป	เวอร์ชัน 1.0
อัลตร้าLM-13B	ฮักกิ้งเฟซ รีโป	เวอร์ชัน 2.0
อัลตร้า RM-13B	ฮักกิ้งเฟซ รีโป	เวอร์ชัน 1.0
อัลตร้าCM-13B	ฮักกิ้งเฟซ รีโป	เวอร์ชัน 1.0

ใช้ UltraLM

หากต้องการสร้าง UltraLM ขึ้นใหม่ โปรดดาวน์โหลด LLaMA-13B และตุ้มน้ำหนัก Delta ของเรา โปรดใช้ลิงก์นี้หากคุณต้องการทดสอบ UltraLM เรายังไม่ได้ประเมินน้ำหนักอื่นๆ ที่จัดทำโดยบุคคลที่สาม
รันสคริปต์ใน /UltraLM/recover.sh เพื่อรับน้ำหนักสุดท้ายของแบบจำลองที่กู้คืน
หลังจากได้รับโมเดลที่กู้คืนแล้ว ให้แทนที่พาธโมเดลใน /UltraLM/chat_cli.sh ด้วยพาธของคุณแล้ววิ่งเพื่อเริ่มแชท!

หมายเหตุ: ไฮเปอร์พารามิเตอร์หรือพรอมต์ของระบบที่แตกต่างกันจะส่งผลต่อเอาต์พุต คุณสามารถดูรายละเอียดใน /UltraLM/inference_cli.py สำหรับการตั้งค่าเริ่มต้นของเรา

ผลงาน

เรารายงานการประเมินสามรายการในส่วนนี้: Alpaca-Eval จาก Stanford, Evol-instruct จาก WizardLM ของ Microsoft และชุดการประเมินที่คัดสรรของเรา การประเมิน LLM สมัยใหม่อาจมีอคติและได้รับผลกระทบจากปัจจัยหลายประการ เรายังทำงานอย่างกระตือรือร้นเกี่ยวกับวิธีการประเมินที่ครอบคลุมมากขึ้น

อัลปาก้า-เอวาล

AlpacaEval เป็นกระดานผู้นำที่ออกแบบมาเพื่อประเมิน LLM โดยเฉพาะ บอร์ดผู้นำถูกสร้างขึ้นตามอัตราการชนะเทียบกับ Text-Davince-003 ที่ประเมินโดยอัตโนมัติโดย GPT-4

Evol-สอน

ชุดข้อมูลนี้สร้างขึ้นด้วยกลยุทธ์เชิงวิวัฒนาการโดยการเขียนคำสั่งใหม่ผ่านหลายรอบเพื่อรับคำสั่งในระดับความซับซ้อนที่แตกต่างกัน เกณฑ์มาตรฐานได้รับการพัฒนาโดยโครงการ WizardLM ซึ่งเป็นโมเดลภาษาแชทที่ยอดเยี่ยมอีกรูปแบบหนึ่ง!

ผลลัพธ์

ชุดการประเมินผลของเรา

เราดูแลจัดการชุดการประเมิน ซึ่งครอบคลุม Vicuna Benchmark และคำถามและคำแนะนำเพิ่มเติมอีก 300 ข้อที่สร้างโดย GPT-4 คำถาม/คำแนะนำครอบคลุมหัวข้อต่างๆ มากมาย รวมถึงสามัญสำนึก ความรู้ทางโลก ความรู้ทางวิชาชีพ (โดยเฉพาะฟิสิกส์และชีววิทยา) คณิตศาสตร์ และงานเขียนในระดับความยากที่แตกต่างกัน เราใช้ GPT-4 ในการประเมิน นี่คือชุดข้อมูล

ผลลัพธ์

ตัวอย่างของ UltraLM

ตัวอย่าง A: คำถามเกี่ยวกับความรู้ทั่วไป
ผู้ใช้: สัตว์ชนิดใดที่เรียกว่าเป็นเพื่อนที่ดีที่สุดของมนุษย์?
UltraLM: มีสัตว์หลายชนิดที่มนุษย์ชอบเป็นสัตว์เป็นเพื่อน แต่หนึ่งในคำตอบที่โดดเด่นที่สุดสำหรับคำถามที่ว่า "สัตว์ชนิดใดที่เรียกว่าเป็นเพื่อนที่ดีที่สุดของมนุษย์" เป็นสุนัขพันธุ์พื้นเมือง สุนัขเลี้ยงในบ้านอยู่เคียงข้างมนุษย์มานับหมื่นปี โดยให้มิตรภาพและความช่วยเหลือที่ซื่อสัตย์ ปกป้องผู้คนและทรัพย์สิน และให้ความช่วยเหลือด้านอารมณ์ในทุกสิ่งตั้งแต่วันที่แสนยาวนานและโดดเดี่ยวไปจนถึงการเข้าประจำการในกองทัพ สุนัขมีหลายสายพันธุ์ในขนาดต่างๆ ที่น่าเหลือเชื่อ โดยมีระดับพลังงาน บุคลิก และลักษณะนิสัยที่แตกต่างกัน ซึ่งหมายความว่ามีลูกสุนัขจำนวนหนึ่งที่จะเหมาะสมอย่างยิ่งสำหรับใครก็ตามที่ต้องการมันมากที่สุด
ตัวอย่าง B: การใช้เหตุผลสามัญสำนึก
ผู้ใช้: สิ่งใดมีน้ำหนักมากกว่า: ขนนกหนึ่งปอนด์หรืออิฐหนึ่งปอนด์
UltraLM: ขนนกหนักหนึ่งปอนด์และอิฐหนักหนึ่งปอนด์ ทั้งคู่มีน้ำหนักหนึ่งปอนด์พอดี เนื่องจากหนึ่งปอนด์เป็นหน่วยของน้ำหนัก เช่นเดียวกับที่ฟุตเป็นหน่วยความยาว หรือวินาทีเป็นหน่วยของเวลา เราใช้ปอนด์ (หรือหน่วยน้ำหนักอื่น) เพื่ออธิบายน้ำหนักของวัตถุต่างๆ โดยไม่คำนึงว่าวัตถุนั้นทำมาจากอะไร คำตอบสำหรับคำถามของคุณก็คือ ขนหนัก 1 ปอนด์ และอิฐ 1 ปอนด์ ต่างก็มีน้ำหนักเท่ากัน
ตัวอย่าง C: การใช้เหตุผล
ผู้ใช้: ถ้าชาวนามีแกะ 17 ตัว แต่ตายไปทั้งหมด 9 ตัว จะเหลือแกะกี่ตัว?
UltraLM: จำนวนแกะทั้งหมดที่เหลืออยู่คือ 9 ตัว
ตัวอย่าง D: การใช้เหตุผล
ผู้ใช้: หากบ้านสีแดงสร้างจากอิฐสีแดง และบ้านสีน้ำเงินสร้างจากอิฐสีน้ำเงิน เรือนกระจกทำมาจากอะไร?
UltraLM: เรือนกระจกไม่ได้ทำจากอิฐสีเขียว แต่ทำจากวัสดุเช่นแก้วหรือพลาสติกที่ให้แสงผ่านได้ และสร้างสภาพแวดล้อมที่มีการควบคุมสำหรับการเจริญเติบโตของพืช โรงเรือนอาจมีหลายสี รวมถึงสีเขียวด้วย แต่สีของตัวอาคารเองไม่ส่งผลกระทบต่อพืชที่ปลูกภายใน
ตัวอย่าง E: การสร้าง
ผู้ใช้: เขียนบทกวีเกี่ยวกับแม่เหล็กไฟฟ้า
UltraLM: แม่เหล็กไฟฟ้าเป็นพลังที่เราไม่อาจมองข้ามได้
มันเป็นเหตุผลของหลายสิ่งที่เราชื่นชอบ ในสนามแม่เหล็ก ลวดจะเรืองแสง
และอิเล็กตรอนก็จะเรียงตัวกันทั้งเก่าและใหม่
ไฟฟ้าและแม่เหล็กเป็นของคู่กัน
คนหนึ่งสร้างสนาม อีกคนหนึ่งมีแบรนด์
สนามแม่เหล็กสามารถผลักและดึงได้
บนสายไฟที่มีกระแสไฟจะทำปฏิกิริยาเต็มที่
แรงดึงดูดและความรังเกียจที่มันนำมาซึ่ง
เป็นสาเหตุหลายประการ
ตั้งแต่มอเตอร์ไปจนถึงเครื่องกำเนิดไฟฟ้า และอื่นๆ อีกมากมาย
แม่เหล็กไฟฟ้าเป็นรากฐานของความหมาย
เป็นพลังที่อยู่รอบตัวเรา
จากเข็มทิศไปจนถึงสวิตช์ไฟ
ด้วยพลังของมัน มันสามารถทำอะไรได้มากมาย
จากเข็มธรรมดาๆ สู่แรงขับของจรวด
มันเป็นพลังที่เราไม่อาจปฏิเสธได้
เพราะมันเป็นส่วนหนึ่งของชีวิตเรา
แม่เหล็กไฟฟ้าเป็นสิ่งที่น่าชื่นชม
ในด้านความแข็งแกร่งและพละกำลังนั้นมันไม่เท่ากันแน่นอน
ตัวอย่าง F: การสร้าง
ผู้ใช้: เขียนเรื่องสั้นเกี่ยวกับวินาทีแรกของจักรวาล
UltraLM: ในวินาทีแรกของจักรวาล ความมืดก็เข้ามาครอบงำ ไม่มีแสง ไม่มีเสียง ไม่มีรูปร่าง ไม่มีสสาร ยังไม่มีอะไรเกิดขึ้น แต่มีพลังอันเข้มข้น เป็นพลังงานดิบที่รอการปลดปล่อย ภายในระยะอนันต์ วินาทีแรกมีศักยภาพในการสร้างสรรค์อยู่ในมือของมัน จากนั้น ด้วยเสียงปังอันทรงพลัง จุดสว่างก็ปรากฏออกมา ในนั้น อนุภาคพื้นฐานที่สุดได้ถือกำเนิดขึ้น โดยยังไม่ทราบรูปแบบของพวกมันในขณะที่พวกมันชนกันอย่างบ้าคลั่งในการเต้นรำแห่งการสร้างสรรค์อันวุ่นวาย ภายในแสงแห่งปฐมกาลนี้ ทุกพลังแห่งธรรมชาติและทุกองค์ประกอบของชีวิตถูกปลุกเร้าจากพลังงานบริสุทธิ์สู่ความเป็นจริงทางกายภาพ อะตอมแรกรวมตัวกันอย่างรวดเร็ว และจากสิ่งเหล่านี้ ดวงดาวและกาแล็กซีก็เริ่มก่อตัวขึ้น การรวมกันของพวกมันสร้างสภาพแวดล้อมที่ร้อนซึ่งผลักดันความว่างเปล่ากลับคืนมา สร้างรูปร่างของจักรวาลผ่านการขยายและทำให้คลื่นเย็นลง ในจักรวาลนี้ประการแรก ไม่มีโครงสร้างของประสบการณ์ แม้แต่เวลาหรืออวกาศก็ไม่สามารถกำหนดกฎเกณฑ์ของมันได้ ชั่วขณะหนึ่ง ความสมบูรณ์ของจักรวาลดำรงอยู่ใน Nexus ของตัวอ่อน ซึ่งเป็นเอกภาวะของจักรวาลซึ่งเป็นจุดเริ่มต้นของการดำรงอยู่ในอนาคตทั้งหมด มันเป็นพิภพเล็ก ๆ ที่หล่อหลอมจักรวาลมหภาคซึ่งในที่สุดมันก็กลายเป็นส่วนหนึ่ง ช่วงเวลาแห่งการกำเนิดของมันเปรียบเสมือนวัฏจักรแห่งการสร้างสรรค์ที่แผ่ซ่านไปทั่วจักรวาล จากจุดแสงจุดเดียวนั้น จักรวาลอันไม่มีที่สิ้นสุดก็เผยออก เป็นเวลาหลายศตวรรษ ชั่วกัลป์ข้างหน้า และตลอดไป มันยังคงเป็นพริบตาที่สำคัญที่สุดของการเดินทางอย่างไม่หยุดยั้งไปสู่ส่วนลึกของ Great Beyond วินาทีแรกคือจุดเริ่มต้นของทุกสิ่ง

ภาพรวมของ UltraChat

โปรเจ็กต์นี้มีจุดมุ่งหมายเพื่อสร้างข้อมูลบทสนทนา แบบโอเพ่นซอร์ส ขนาดใหญ่ และหลายรอบ ที่ขับเคลื่อนโดย Turbo API เพื่ออำนวยความสะดวกในการสร้างโมเดลภาษาที่มีประสิทธิภาพพร้อมความสามารถในการสนทนาทั่วไป ในการพิจารณาปัจจัยต่างๆ เช่น การปกป้องความเป็นส่วนตัว เราจะไม่ใช้ข้อมูลใดๆ ที่มีอยู่บนอินเทอร์เน็ตโดยตรงตามที่ได้รับแจ้ง

UltraChat ประกอบด้วยสามส่วน

- คำถามเกี่ยวกับโลก : ข้อมูลบทสนทนาในภาคนี้ได้มาจากคำถามที่หลากหลายที่เกี่ยวข้องกับแนวคิด ตัวตน และวัตถุจากโลกแห่งความเป็นจริง หัวข้อที่ครอบคลุมมีเนื้อหากว้างขวาง ครอบคลุมสาขาต่างๆ เช่น เทคโนโลยี ศิลปะ และความเป็นผู้ประกอบการ
? การเขียนและการสร้าง : ข้อมูลบทสนทนาในภาคนี้ได้รับแรงผลักดันจากความต้องการในการเขียน/การสร้างสรรค์ตั้งแต่เริ่มต้น และครอบคลุมงานใดๆ ที่ผู้ช่วย AI อาจช่วยในกระบวนการสร้างสรรค์ ครอบคลุมตั้งแต่การจัดองค์ประกอบอีเมลไปจนถึงการประดิษฐ์เรื่องราวและบทละคร และอื่นๆ อีกมากมาย
- ความช่วยเหลือเกี่ยวกับสื่อที่มีอยู่ : ข้อมูลการสนทนาในภาคนี้สร้างขึ้นจากสื่อที่มีอยู่ ซึ่งรวมถึงแต่ไม่จำกัดเพียงการเขียนใหม่ การต่อยอด การสรุป และการอนุมาน ซึ่งครอบคลุมหัวข้อที่หลากหลาย

ข้อสงวนสิทธิ์: แม้ว่ากระบวนการสร้าง UltraChat จะไม่เกี่ยวข้องกับข้อมูลการวัดประสิทธิภาพที่เปิดเผยต่อสาธารณะ แต่การปรับขนาดในระดับหนึ่งอาจยังส่งผลให้เกิดการทับซ้อนกันในการวัดประสิทธิภาพการประเมินบางอย่าง เราขอย้ำอีกครั้งว่า ข้อมูลทั้งหมดถูกสร้างขึ้นโดยอัตโนมัติ (รวมถึงคำแนะนำและการตอบกลับ) และเราจะไม่แทรกข้อมูลการวัดประสิทธิภาพแบบเปิดใดๆ เช่น UltraChat เปิดตัว (เมษายน 2023) ก่อน Alpaca Eval (พฤษภาคม 2023) เราขอแนะนำให้ผู้ใช้ติดตามปรากฏการณ์ดังกล่าวอย่างใกล้ชิด ในขณะที่เรากำลังพิจารณาอย่างจริงจังว่าจะประเมิน LLM อย่างไรให้เหมาะสมยิ่งขึ้น

ตัวอย่างของ UltraChat

ข้อมูล

ชุดข้อมูลนี้มีจุดประสงค์เพื่อการวิจัยและการศึกษาเท่านั้น และไม่ควรตีความว่าเป็นการสะท้อนความคิดเห็นหรือมุมมองของผู้สร้าง เจ้าของ หรือผู้ร่วมให้ข้อมูลชุดข้อมูลนี้ และเผยแพร่ภายใต้ใบอนุญาต MIT

การเปิดเผยข้อมูล

สำรวจข้อมูลก่อนดาวน์โหลด หรือใช้ Atlas explorer

- โฮสต์ชุดข้อมูล Huggingface

ลิงค์ดาวน์โหลดโดยตรง:

คำถามเกี่ยวกับโลก [ตอนที่ 1 + ตอนที่ 2]
การเขียนและการสร้างสรรค์ [ตอนที่ 1]
การเขียนและการสร้างสรรค์ [ตอนที่ II]
ความช่วยเหลือเกี่ยวกับวัสดุที่มีอยู่ [ส่วนที่ 1]

รูปแบบข้อมูล

แต่ละบรรทัดในไฟล์ข้อมูลที่ดาวน์โหลดคือ json dict ที่มีรหัสข้อมูลและข้อมูลบทสนทนาในรูปแบบรายการ ด้านล่างเป็นบรรทัดตัวอย่าง

{
  "id" : " 0 " , 
  "data" : [
    " How can cross training benefit groups like runners, swimmers, or weightlifters? " , 
    " Cross training can benefit groups like runners, swimmers, or weightlifters in the following ways: ... " , 
    " That makes sense. I've been wanting to improve my running time, but I never thought about incorporating strength training. Do you have any recommendations for specific exercises? " , 
    " Sure, here are some strength training exercises that can benefit runners: ... " , 
    " Hmm, I'm not really a fan of weightlifting though. Can I incorporate other forms of exercise into my routine to improve my running time? " , 
    " Yes, absolutely! ... " ,
    " ... "
    ]
}

การฝึกอบรม

เราจัดเตรียมโค้ดการฝึกอบรมเพื่อปรับแต่ง LLaMa (แต่เราจะไม่กระจายน้ำหนักของ LLaMa) บน UltraChat ใน .src/ การฝึกอบรมจะถูกเร่งโดย BMTrain

ดาวน์โหลดข้อมูลที่เผยแพร่และวางไว้ใต้ ./data

เรียกใช้ train_bm.py เช่น:

WANDB_MODE= " offline " torchrun --nnodes=1 --nproc_per_node=8 --rdzv_id=1 --rdzv_backend=c10d --rdzv_endpoint=localhost:50003 train_bm.py --tensorboard ./ultrachat_llama_tb_2 --save_step 5000 --logging_step 100

นอกจากนี้เรายังจัดเตรียมสคริปต์การฝึกอบรมเพื่อปรับแต่ง GPT-J บน UltraChat ใน .src/train_legacy/ ซึ่งนำไปใช้กับ OpenPrompt

ดาวน์โหลดข้อมูลที่เผยแพร่และวางไว้ใต้ ./data
รัน accelerate launch train.py เพื่อเริ่มการฝึก

การสร้าง UltraChat

แนวคิดทั่วไปของ UltraChat คือการใช้ LLM แยกกันเพื่อสร้างบรรทัดเปิด จำลองผู้ใช้ และตอบคำถาม แต่ละส่วนของ UltraChat มีความท้าทายของตัวเองและต้องมีการออกแบบกลยุทธ์เฉพาะ เราจะระบุขั้นตอนการก่อสร้างเมื่อมีการเปิดตัวเซกเตอร์ของ UltraChat

คำถามเกี่ยวกับโลก

หัวข้อ Meta และหัวข้อย่อย

ข้อมูลได้มาจากตัวแทน 30 รายและหัวข้อเมตาที่หลากหลาย (ไอคอนมาจากไอคอนแบน)

จากหัวข้อเมตาข้างต้น เราสร้างหัวข้อย่อยมากกว่า 1,100 หัวข้อสำหรับการสร้างข้อมูล
สำหรับแต่ละหัวข้อย่อย เราสร้างคำถามเฉพาะได้ถึง 10 ข้อ
จากนั้นเราใช้ Turbo API เพื่อสร้างคำถามที่เกี่ยวข้องใหม่สำหรับคำถามทั้ง 10 ข้อ เราใช้พรอมต์ที่สร้างขึ้นด้วยมือเพื่อสั่งให้โมเดลสร้างชุดคำถามที่หลากหลายซึ่งครอบคลุมแนวคิดและวัตถุทั่วไปที่หลากหลาย
สำหรับคำถามแต่ละข้อ เราจะสร้างบทสนทนา 3~7 รอบโดยใช้ทั้งสองโมเดลซ้ำๆ ตามที่อธิบายไว้ข้างต้น

เอนทิตีในโลกแห่งความเป็นจริงทั่วไป

เรารวบรวมชื่อเอนทิตีที่มีชื่อบ่อยที่สุด 10,000 รายการจาก Wikidata
เราสร้างคำถามเมตา 5 ข้อสำหรับแต่ละเอนทิตีโดยใช้ ChatGPT API
สำหรับคำถามเมตาแต่ละข้อ เราจะสร้างคำถามที่เฉพาะเจาะจงมากขึ้น 10 คำถาม และคำถามที่เกี่ยวข้องกันแต่เป็นคำถามทั่วไป 20 คำถาม
เราสุ่มตัวอย่างคำถามเฉพาะ 200,000 คำถามและคำถามทั่วไป 250,000 คำถามพร้อมกับคำถามเมตา 50,000 ข้อ และเราสร้างบทสนทนา 3~7 รอบสำหรับแต่ละคำถาม

การเขียนและการสร้างสรรค์

ก่อนอื่นเรารวบรวมการเขียน 20 ประเภทดังที่แสดงด้านล่าง (ไอคอนมาจากไอคอนแบน)

สำหรับการเขียนแต่ละประเภท ให้สร้างคำสั่งที่แตกต่างกัน 200 คำสั่งซึ่งขอให้ผู้ช่วย AI สร้างเนื้อหาข้อความ และ 80% ของคำสั่งนั้นได้รับการขยายและให้รายละเอียดเพิ่มเติม
ใช้คำแนะนำที่สร้างขึ้นเป็นข้อมูลเบื้องต้น และสร้างบทสนทนา 2~4 รอบต่อรายการ

ความช่วยเหลือเกี่ยวกับวัสดุที่มีอยู่

เราแยกวัสดุที่หลากหลายประมาณ 10w จากชุดข้อมูล C4
เราสร้างคำถาม/คำแนะนำได้สูงสุด 5 ข้อสำหรับเนื้อหาแต่ละชิ้น
เรารวมเนื้อหาเข้ากับคำถาม/คำแนะนำแต่ละข้อเข้ากับชุดเทมเพลตที่ออกแบบด้วยตนเองเพื่อเป็นข้อมูลเบื้องต้นของผู้ใช้เพื่อเริ่มการสนทนากับผู้ช่วย AI
สำหรับแต่ละอินพุต เราจะสร้างบทสนทนา 2~4 รอบ

สิ่งที่ต้องทำ

เผยแพร่ส่วนที่เหลือของข้อมูลสำหรับคำถามเกี่ยวกับโลก
เผยแพร่ข้อมูลการเขียนและการสร้างสรรค์ต่อไป
ดำเนินการเผยแพร่ข้อมูล Assistance on Existent Materials ต่อไปในอนาคต
ฝึกฝนโมเดลบน UltraChat และดำเนินการวิเคราะห์โดยละเอียด ยินดีต้อนรับสู่การใช้มันเพื่อฝึกฝนโมเดลการแชทของคุณ!
จะมี UltraChat เวอร์ชันภาษาจีน

ข้อจำกัด

แม้ว่า UltraChat สามารถทำงานได้อย่างมีแนวโน้มบนเกณฑ์มาตรฐานหลายประการ แต่ก็ยังมีข้อจำกัด เช่น อาการประสาทหลอน จากประสบการณ์ของเรา UltraLM สามารถจัดการกับคำถามในแง่ของความรู้และการสร้างสรรค์ของโลกได้ ความสามารถในการใช้เหตุผล คณิตศาสตร์ และการเขียนโค้ดยังคงต้องได้รับการปรับปรุงอย่างชัดเจน

การอ้างอิง

อย่าลังเลที่จะอ้างอิง repo หากคุณคิดว่า UltraChat มีประโยชน์

 @article { ding2023enhancing ,
  title = { Enhancing Chat Language Models by Scaling High-quality Instructional Conversations } ,
  author = { Ding, Ning and Chen, Yulin and Xu, Bokai and Qin, Yujia and Zheng, Zhi and Hu, Shengding and Liu, Zhiyuan and Sun, Maosong and Zhou, Bowen } ,
  journal = { arXiv preprint arXiv:2305.14233 } ,
  year = { 2023 }
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2024-12-10
ขนาด 5.34MB
มาจาก Github

แอปที่เกี่ยวข้อง

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
node telegram bot api

โค้ดแหล่งที่มา AI

v0.50.0
typebot.io

โค้ดแหล่งที่มา AI

v3.1.2
python wechaty getting started

โค้ดแหล่งที่มา AI

1.0.0
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด