ชุดข้อมูลการปรับแต่งคำสั่ง
ชุดข้อมูลที่มีอยู่ทั้งหมดสำหรับการปรับแต่งคำสั่งของโมเดลภาษาขนาดใหญ่
ชุดข้อมูลมาตรฐานทองคำ
- P3: https://github.com/bigscience-workshop/promptsource, https://huggingface.co/datasets/bigscience/P3
- การรวบรวมชุดข้อมูลภาษาอังกฤษที่ได้รับแจ้งซึ่งครอบคลุมชุดงาน NLP ที่หลากหลาย
- พรอมต์ 2,000 ประเภทมากกว่า 270 ชุดข้อมูล
- xP3: https://huggingface.co/datasets/bigscience/xP3mt
- การผสมผสานของงานฝึกอบรม 13 งานใน 46 ภาษาพร้อมข้อความแจ้งใน 20 ภาษา (แปลด้วยเครื่องจากภาษาอังกฤษ)
- คำแนะนำตามธรรมชาติ v2: https://github.com/allenai/natural-instructions
- เกณฑ์มาตรฐานของงาน NLP ที่หลากหลาย 1,616 งานและคำแนะนำที่ผู้เชี่ยวชาญเขียนขึ้น ครอบคลุมงาน 76 ประเภทที่แตกต่างกันและ 55 ภาษาที่แตกต่างกัน
- คอลเลกชัน Flan: https://github.com/google-research/FLAN/tree/main/flan/v2
- แทนที่ชุดข้อมูลบางชุดที่นี่
- 1836 งาน 15 ล้านตัวอย่าง
- เปิดผู้ช่วย: https://huggingface.co/datasets/OpenAssistant/oasst1
- คลังการสนทนาสไตล์ผู้ช่วยที่มีคำอธิบายประกอบโดยมนุษย์ประกอบด้วยข้อความ 161,443 ข้อความที่กระจายอยู่ในแผนผังการสนทนา 66,497 รายการใน 35 ภาษาที่แตกต่างกัน มีคำอธิบายประกอบด้วยคะแนนคุณภาพ 461,292 รายการ
- LIMA: คำแนะนำคุณภาพสูง 1K
- https://huggingface.co/datasets/GAIR/lima
- databricks-dolly-15k: https://github.com/databrickslabs/dolly/tree/master/data
- เพรสโต: https://github.com/google-research-datasets/presto
- บทสนทนาหลายภาษาตามบริบท 550,000 รายการระหว่างมนุษย์และผู้ช่วยเสมือน
- BB3x: https://parl.ai/projects/bb3x/
- InstructCTG: https://github.com/MichaelZhouwang/InstructCTG
- กรอบการทำงานสำหรับรุ่นควบคุมhttps://arxiv.org/abs/2304.14293
- ครอสฟิต: https://github.com/INK-USC/CrossFit
- แหล่งที่มาของงาน: https://arxiv.org/abs/2301.05948
- ExMix: https://arxiv.org/abs/2111.10952
- InstructEval: https://github.com/declare-lab/instruct-eval
- M3IT: https://huggingface.co/datasets/MMInstruction/M3IT
- https://arxiv.org/abs/2306.04387
- อินสแตนซ์หลายรูปแบบ 2.4 ล้านรายการและคำสั่ง 400 รายการใน 40 งานและ 80 ภาษา
- MIMIC-IT: การปรับแต่งคำสั่งในบริบทหลายรูปแบบ: https://arxiv.org/abs/2306.05425
- MultiInstruct: https://github.com/VT-NLP/MultiInstruct
- คอลลี่: https://github.com/princeton-nlp/Collie
- Mind2Web: สู่ตัวแทนทั่วไปสำหรับเว็บ https://osu-nlp-group.github.io/Mind2Web/
- Android in the Wild: ชุดข้อมูลขนาดใหญ่สำหรับการควบคุมอุปกรณ์ Android: https://github.com/google-research/google-research/tree/master/android_in_the_wild
- FLASK: การประเมินแบบจำลองภาษาแบบละเอียดตามชุดทักษะการจัดตำแหน่ง https://github.com/kaistAI/FLASK
- ปลอดภัย-RLHF: https://arxiv.org/abs/2310.12773
- https://arxiv.org/pdf/2310.12773.pdf#https%3A//github.com/PKU-Alignment/safe-rlhf
- HelpSteer: https://huggingface.co/datasets/nvidia/HelpSteer
มาตรฐานเงิน/สร้างโดยใช้ LM
- การสอนด้วยตนเอง: https://github.com/yizhongw/self-instruct
- คำแนะนำที่ไม่เป็นธรรมชาติ: https://github.com/orhonovich/unnatural-instructions
- อัลปาก้า: https://huggingface.co/datasets/tatsu-lab/alpaca
- อัลปาก้าสะอาด: https://github.com/gururise/AlpacaDataCleaned
- โค้ดอัลปาก้า: https://github.com/sahil280114/codealpaca
- AlpacaGPT3.5กำหนดเอง: https://huggingface.co/datasets/whitefox44/AlpacaGPT3.5Customized
- GPT4All: https://github.com/nomic-ai/gpt4all
- GPT4All-pruned: https://huggingface.co/datasets/Nebulous/gpt4all_pruned
- ShareGPT: https://huggingface.co/datasets/RyokoAI/ShareGPT52K
- GPTeacher: https://github.com/teknium1/GPTeacher
- อูฐ?: https://www.camel-ai.org/
- คลังการเปรียบเทียบ Human ChatGPT: https://github.com/Hello-SimpleAI/chatgpt-comparison-detection
- InstructionWild: https://github.com/XueFuzhao/InstructionWild
- การปรับแต่งคำสั่งด้วย GPT-4: https://github.com/Instruction-Tuning-with-GPT-4/GPT-4-LLM
- กวานาโก: https://huggingface.co/datasets/JosephusCheung/GuanacoDataset
- ชุดข้อมูล LongForm: https://github.com/akoksal/LongForm/tree/main/dataset
- การสร้างคำสั่ง LLM สำหรับชุดตัวอย่างคลังข้อมูลที่หลากหลาย (คำสั่ง 27,739 รายการและคู่ข้อความขนาดยาว)
- UltraChat: https://huggingface.co/datasets/stingning/ultrachat
- คำแนะนำแบบภาพ LLaVA 150K: https://huggingface.co/datasets/liuhaotian/LLaVA-Instruct-150K
- ข้อมูลตามคำสั่งต่อเนื่องหลายรูปแบบที่สร้างโดย GPT
- GPT4Tools: https://github.com/StevenGrove/GPT4Tools
- ข้อมูลคำสั่งในการเรียก API ไปยังโมเดลหลายรูปแบบหลายรูปแบบ
- LaMini-คำแนะนำ: https://huggingface.co/datasets/MBZUAI/LaMini-instruction
- คำแนะนำและการตอบกลับ 2.58 ล้านคู่
- Evol-Instruct 70k: https://github.com/nlpxucan/WizardLM
- ไดโนซอร์: https://dynosaur-it.github.io/
- ฟาร์มอัลปาก้า: https://github.com/tatsu-lab/alpaca_farm
- https://huggingface.co/datasets/tatsu-lab/alpaca_farm
- ign_clean_instruct_dataset_500k: https://huggingface.co/datasets/ignmilton/ign_clean_instruct_dataset_500k
- airoboros: https://github.com/jondurbin/airoboros
- อัลตร้าฟีดแบ็ค: https://huggingface.co/datasets/openbmb/UltraFeedback
- WildChat: คลังข้อมูลของการโต้ตอบระหว่างผู้ใช้กับ ChatGPT ในโลกแห่งความเป็นจริง 570,000 ครั้ง https://wildchat.allen.ai/
- การรวบรวมคำติชม: https://arxiv.org/abs/2310.08491
- https://huggingface.co/datasets/kaist-ai/Feedback-Collection
ชุดข้อมูลการตั้งค่า (สามารถใช้เพื่อฝึกโมเดลรางวัลได้)
- HH-RLHF: https://huggingface.co/datasets/Anthropic/hh-rlhf
- ประกอบด้วยการให้คะแนนโดยมนุษย์เกี่ยวกับความเป็นอันตรายและความเป็นประโยชน์ของเอาต์พุตโมเดล ชุดข้อมูลประกอบด้วยตัวอย่างที่ประเมินโดยมนุษย์ประมาณ 160,000 ตัวอย่าง โดยแต่ละตัวอย่างในชุดข้อมูลนี้ประกอบด้วยคู่ของการตอบกลับจากแชทบอท ซึ่งหนึ่งในนั้นเป็นที่ต้องการของมนุษย์
- OpenAI WebGPT: https://huggingface.co/datasets/openai/webgpt_comparisons
- รวมการเปรียบเทียบทั้งหมดประมาณ 20,000 รายการ โดยแต่ละตัวอย่างประกอบด้วยคำถาม คู่คำตอบของแบบจำลอง และข้อมูลเมตา คำตอบได้รับการจัดอันดับโดยมนุษย์โดยมีคะแนนความชอบ
- การสรุป OpenAI: https://huggingface.co/datasets/openai/summarize_from_feedback
- มีตัวอย่างประมาณ 93,000 ตัวอย่าง แต่ละตัวอย่างประกอบด้วยคำติชมจากมนุษย์เกี่ยวกับการสรุปที่สร้างโดยแบบจำลอง ผู้ประเมินที่เป็นมนุษย์เลือกข้อสรุปที่เหนือกว่าจากสองตัวเลือก
- ชุดข้อมูลการตั้งค่าของมนุษย์สแตนฟอร์ด (SHP): https://huggingface.co/datasets/stanfordnlp/SHP
- ความพึงพอใจของมนุษย์โดยรวมมากกว่าการตอบคำถาม/คำแนะนำใน 18 สาขาวิชาที่แตกต่างกัน
- การตั้งค่าการแลกเปลี่ยนสแต็ก: https://huggingface.co/datasets/HuggingFaceH4/stack-exchange-preferences
- SLF5K: https://huggingface.co/datasets/JeremyAlain/SLF5K
- qa-from-hf: https://github.com/lil-lab/qa-from-hf
- น้ำหวาน: https://huggingface.co/datasets/berkeley-nest/Nectar
- ผู้ตัดสินLM-100K: https://huggingface.co/datasets/BAAI/JudgeLM-100K
- อัลตร้าฟีดแบ็ค: https://huggingface.co/datasets/openbmb/UltraFeedback
เบ็ดเตล็ด
- OIG: https://huggingface.co/datasets/laion/OIG
- ซูเปอร์เซ็ตของชุดข้อมูลบางส่วนที่นี่
- oa_leet10k: https://huggingface.co/datasets/ehartford/oa_leet10k
- ปัญหา LeetCode ได้รับการแก้ไขในภาษาการเขียนโปรแกรมหลายภาษา
- กล่องโต้ตอบ ProSocial: https://huggingface.co/datasets/allenai/prosocial-dialog
- ConvoKit: https://convokit.cornell.edu/documentation/datasets.html
- CoT-Collection: https://github.com/kaist-lklab/CoT-Collection
- DialogStudio: https://github.com/salesforce/DialogStudio
- บทสนทนา Chatbot Arena https://huggingface.co/datasets/lmsys/chatbot_arena_conversations
- lmsys 1M: https://huggingface.co/datasets/lmsys/lmsys-chat-1m
- พงศาวดารการสนทนา: https://conversation-chronicles.github.io/