ดาวน์โหลด KokoMind - ดาวน์โหลดซอร์สโค้ด KokoMind

KokoMind

ซอร์สโค้ดอื่น ๆ

KokoMind 0.1 Release

ดาวน์โหลด

Kokomind

นี่คือ repo สำหรับ Kokomind ชุดข้อมูลที่มีปฏิสัมพันธ์ทางสังคมหลายพรรคเพื่อประเมินความสามารถในการทำความเข้าใจทางสังคมของ LLMS repo ประกอบด้วย:

ข้อมูลการประเมินผลของปฏิสัมพันธ์ทางสังคม
รหัสสำหรับการประเมินแบบจำลอง
ตรวจสอบโพสต์บล็อกของ Kokomind เพื่อดูการสาธิต

โลโก้ของ Kokomind

ข่าว

[2023.07.05] Kokomind เปิดตัวที่ https://chats-lab.github.io/kokomind/

การสาธิต

demo2.mp4

ชุดข้อมูล

Kokomind มีปฏิสัมพันธ์ทางสังคมหลายพรรคที่ซับซ้อน 150 (50 ต่อแหล่ง) พร้อมคำถามและคำตอบข้อความฟรี เพื่อให้แน่ใจว่ามีความหลากหลายและความยืดหยุ่นและหลีกเลี่ยงการปนเปื้อนข้อมูลปฏิสัมพันธ์ทางสังคมคำถามและคำตอบทั้งหมดถูกสร้างขึ้นโดย GPT-4 และตรวจสอบโดยผู้เชี่ยวชาญของมนุษย์ในภายหลัง รุ่นเหล่านี้ขึ้นอยู่กับสามแหล่งที่แตกต่างกัน:

- GPT-4-only: ชุดย่อยนี้ถูกสร้างขึ้นโดย GPT-4 เพียงอย่างเดียวผ่านการแจ้งเตือนโดยไม่ต้องต่อสายดินกับแหล่งที่มีอยู่
- ภาพยนตร์: เพื่อหลีกเลี่ยงการปนเปื้อนข้อมูลส่วนนี้ของข้อมูลนี้มีพื้นฐานอยู่บนสถานการณ์ที่หลากหลายดึงออกมาจากภาพยนตร์ที่ปล่อยออกมาหลังจากปี 2022 GPT-4 รูปร่างสถานการณ์เหล่านี้รักษาแก่นแท้หลักในขณะที่เพิ่มองค์ประกอบของตัวเอง
- Tomi-based: เซ็กเมนต์นี้มีข้อมูลย้อนกลับโดยชุดข้อมูลจำลอง Tomi ซึ่งเกี่ยวข้องกับการเคลื่อนย้ายวัตถุทางกายภาพไปยังสถานที่ต่าง ๆ การทดสอบแบบคลาสสิกสำหรับทฤษฎีของจิตใจ ปฏิสัมพันธ์ทางสังคมเหล่านี้ถูกประดับประดาและขยายอีกครั้งโดย GPT-4

สำหรับการปฏิสัมพันธ์ทางสังคมแต่ละครั้งเราถามคำถามต่าง ๆ ที่ออกแบบมาเพื่อตรวจสอบแง่มุมของความเข้าใจทางสังคมต่อไปนี้

- ทฤษฎีของจิตใจ: คำถามที่ประเมินความเข้าใจในสภาพจิตใจและมุมมองของผู้อื่น
- บรรทัดฐานทางสังคม: คำถามที่มีวัตถุประสงค์เพื่อมองเห็นคุณค่าทางสังคมและบรรทัดฐานภายในสถานการณ์
- การรับรู้อารมณ์: คำถามที่กำหนดเป้าหมายในการระบุและทำความเข้าใจองค์ประกอบทางอารมณ์ภายในบริบท
?? ความสัมพันธ์ทางสังคม: คำถามที่มุ่งเน้นไปที่การเปลี่ยนแปลงระหว่างบุคคลและความสัมพันธ์
- คำถามที่ต่อต้าน: คำค้นหาสมมุติที่ออกแบบมาเพื่อสำรวจผลลัพธ์หรือความเป็นไปได้ทางเลือก
คำแนะนำทางสังคม: คำถามที่แสดงคำแนะนำหรือคำแนะนำการดำเนินการที่เกี่ยวข้องกับสถานการณ์ที่กำหนด

question_nonverbal_yes_v0.1.json มีตัวอย่างทั้งหมด 770 ตัวอย่าง ไฟล์บรรทัด JSON นี้เป็นรายการพจนานุกรมโดยแต่ละพจนานุกรมมีฟิลด์ต่อไปนี้:

question_id : int, รหัสที่ไม่ซ้ำกันของคำถาม
text : Str, บริบทและคำถามปฏิสัมพันธ์ทางสังคม
answer : STR, GPT-4 คำตอบที่มนุษย์ได้รับการตรวจสอบเพิ่มเติม
source : STR หนึ่งในสามแหล่งข้อมูล: gpt-4 , movie , tomi
category : STR, หนึ่งในหกประเภทคำถาม: ToM , Social Norm , Emotion Recognition , Social Relation , Counterfactual , Social Advice

question_nonverbal_no_v0.1.json มีปฏิสัมพันธ์และคำถามทางสังคมเดียวกัน แต่ด้วยตัวชี้นำที่ไม่ใช่คำพูดในวงเล็บ (เช่นจิบกาแฟ ฯลฯ ) ที่ถูกลบออกจากบริบท

การประเมิน

สิ่งที่ต้องมีก่อน

pip install -r requirements.txt
export OPENAI_API_KEY= < your_api_key >
export ANTHROPIC_API_KEY= < your_api_key >

สร้างคำตอบแบบจำลอง

 # Generate local model anwers
# Use vicuna-7b as an example
python eval/get_model_answer.py --model-path ${PATH_TO_LOCAL_HF_MODEL} --model-id vicuna-7b --question-file data/question_nonverbal_yes_v0.1.jsonl --answer-file data/answer/answer_vicuna-7b.jsonl --num-gpus 8

# GPT-3 answer (reference model by alpaca-eval)
python eval/qa_baseline_gpt3.py -q data/question_nonverbal_yes_v0.1.jsonl -o data/answer/answer_gpt3.jsonl

# GPT-3.5 answer
python eval/qa_baseline_gpt35.py -q data/question_nonverbal_yes_v0.1.jsonl -o data/answer/answer_gpt35.jsonl

# GPT-4.0 answer
python eval/qa_baseline_gpt4.py -q data/question_nonverbal_yes_v0.1.jsonl -o data/answer/answer_gpt4.jsonl

# Claude answer
python eval/qa_baseline_claude.py -q data/question_nonverbal_yes_v0.1.jsonl -o data/answer/answer_claude.jsonl

เรียกใช้การประเมินผล

การประเมินของเราขึ้นอยู่กับ Alpaca-Eval

 # Convert to alpaca_eval input format
python eval/generate_alpaca_eval.py -q data/question_nonverbal_yes_v0.1.jsonl -a data/answer/answer_gpt3.jsonl -o data/alpaca_eval/answer_gpt3.json

alpaca_eval make_leaderboard --leaderboard_path data/alpaca_results/leaderboard.csv --all_model_outputs " ./data/alpaca_eval/answer_* " --reference_outputs data/alpaca_eval/answer_gpt3.json --is_overwrite_leaderboard True

ใบอนุญาต

โครงการนี้เป็นงานวิจัยการวิจัยระยะแรกที่ออกแบบมาเพื่อวัตถุประสงค์ที่ไม่ใช่เชิงพาณิชย์เท่านั้น มันปฏิบัติตามข้อกำหนดการใช้ข้อมูลของ OpenAI และแนวทางปฏิบัติด้านความเป็นส่วนตัวของ ShareGPT แจ้งให้เราทราบหากคุณเห็นการละเมิดที่อาจเกิดขึ้น รหัสของซอฟต์แวร์พร้อมใช้งานภายใต้ Apache License 2.0

การรับทราบ

เราขอขอบคุณ Yejin Choi จาก UW, Louis-Philippe Morency จาก CMU, Jason Weston จาก Meta และ Diyi Yang จาก Stanford สำหรับบทสนทนาที่รู้แจ้งและอินพุตที่สร้างสรรค์ รากฐานทางทฤษฎีของ Kokomind นั้นมีพื้นฐานมาจากการวิจัยระดับปริญญาเอกของ Liang กับ Song-Chun Zhu จากมหาวิทยาลัยปักกิ่ง, มหาวิทยาลัย Tsinghua และ Institute Beijing สำหรับปัญญาประดิษฐ์ทั่วไป (BIGAI) และ Ying Nian Wu จาก UCLA

การอ้างอิง

โปรดอ้างอิงงานของเราหากคุณพบว่ามีประโยชน์

 @misc { Shi_KokoMind_Can_Large_2023 ,
  author = { Shi, Weiyan and Qiu, Liang and Xu, Dehong and Sui, Pengwei and Lu, Pan and Yu, Zhou } ,
  title = { {KokoMind: Can Large Language Models Understand Social Interactions?} } ,
  month = jul,
  year = { 2023 } ,
  url = { https://chats-lab.github.io/KokoMind/ }
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน KokoMind 0.1 Release
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-02-26
ขนาด 52.7MB
มาจาก Github

แอปที่เกี่ยวข้อง

waymo open dataset

2024-11-18
Sunamu

2024-12-14
MySchedule.py

2024-12-15
SmartTube

2024-12-14
chat.petals.dev

2024-11-30
viptools for eslam

2024-12-15

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
Sunamu

ซอร์สโค้ดอื่น ๆ

Release 2.2.0
MySchedule.py

ซอร์สโค้ดอื่น ๆ

Updates to the fetching of week codes
waymo open dataset

ซอร์สโค้ดอื่น ๆ

December 2023 Update
termwind

หมวดหมู่อื่นๆ

v2.3.0
wp functions

หมวดหมู่อื่นๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด