กรุณาลงทะเบียน: https://goo.gl/forms/Fxy061gHuSOZGC1i2
ชุดวิเคราะห์ประเมินผล: 19 ม.ค. 2561
แพ็คเกจประกอบด้วยข้อมูลอ้างอิงทั้งหมดที่สร้างโดยมนุษย์ 11 คน สมมติฐานของระบบ 20 ระบบ และผลการประเมินในแทร็กการสร้างแบบจำลองการสนทนาแบบ end-to-end ของ DSTC6 https://www.dropbox.com/s/oh1trbos0tjzn7t/dstc6_t2_evalue.tgz
ดาวน์โหลดข้อมูลการฝึกอบรมอย่างเป็นทางการ: 7-18 กันยายน 2560
การกระจายข้อมูลทดสอบ: 25 กันยายน 2017
ส่ง: 8 ต.ค. 2017
งานหลัก (บังคับ): กล่องโต้ตอบการบริการลูกค้าโดยใช้ Twitter
(*) มีเครื่องมือในการดาวน์โหลดข้อมูล Twitter และแปลงเป็นรูปแบบกล่องโต้ตอบจากข้อมูล
งาน A: ข้อมูลการฝึกอบรมทั้งหมดหรือบางส่วนจะถูกนำมาใช้ในการฝึกโมเดลการสนทนา
งาน B: ข้อมูลเปิดใดๆ เช่น จากเว็บ สามารถใช้เป็นความรู้ภายนอกเพื่อสร้างประโยคที่ให้ข้อมูล แต่ไม่ควรทับซ้อนกับข้อมูลการฝึกอบรม การตรวจสอบ และการทดสอบที่ได้รับจากผู้จัดงาน
งานนำร่อง: กล่องโต้ตอบสถานการณ์ภาพยนตร์โดยใช้ OpenSubtitle
โปรดอ้างอิงเอกสารต่อไปนี้หากคุณจะเผยแพร่ผลลัพธ์โดยใช้การตั้งค่านี้:
https://arxiv.org/pdf/1706.07440.pdf
@article{DSTC6_End-to-End_Conversation_Modeling,
Author = {Chiori Hori and Takaaki Hori},
Title = {End-to-end Conversation Modeling Track in DSTC6},
Journal = {arXiv:1706.07440},
Year = {2017}
}
เครื่องมือส่วนใหญ่เขียนด้วยภาษา Python ซึ่งได้รับการทดสอบบน python2.7.6+ และ python3.4.1+ และสคริปต์ทุบตีบางตัวก็ใช้ในการรันเครื่องมือเหล่านั้นด้วย
ในการจัดเตรียมข้อมูล คุณจะต้องมีโมดูลหลามเพิ่มเติมดังต่อไปนี้:
ซึ่งสามารถติดตั้งได้โดย
pip install <module-name>
หรือ
pip install <module-name> -t <some-directory>
โดยที่ <some-directory>
เป็นไดเร็กทอรีที่เก็บโมดูล python และจำเป็นต้องเข้าถึงได้จาก python เช่น โดยการรวมไว้ในตัวแปรสภาพแวดล้อม PYTHONPATH
หากคุณลองใช้ระบบพื้นฐาน คุณจะต้องมี Chainer http://chainer.org ซึ่งเป็นชุดเครื่องมือการเรียนรู้เชิงลึก เพื่อดำเนินการฝึกอบรมและประเมินโมเดลการสนทนาทางประสาท โปรดปฏิบัติตามคำแนะนำใน ChatbotBaseline/README.md
เตรียมชุดข้อมูลโดยใช้สคริปต์ collect_twitter_dialogs
$ cd collect_twitter_dialogs
$ collect.sh
(จำเป็นต้องมีบัญชี Twitter และคีย์การเข้าถึงเพื่อเรียกใช้สคริปต์ ทำตามคำแนะนำใน collect_twitter_dialogs/README.md
)
แยกชุดการฝึกอบรม การพัฒนา และการทดสอบออกจากข้อมูลกล่องโต้ตอบ Twitter ที่เก็บไว้
$ cd ../tasks/twitter
$ make_trial_data.sh
หมายเหตุ: ข้อมูลที่แยกออกมาเป็นข้อมูลทดลองในขณะนี้
รันระบบพื้นฐาน (ไม่จำเป็น)
$ cd ../../ChatbotBaseline/egs/twitter
$ run.sh
(ดู ChatbotBaseline/README.md
)
ดาวน์โหลดข้อมูล OpenSubtitles2016
$ cd tasks/opensubs
$ wget http://opus.lingfil.uu.se/download.php?f=OpenSubtitles2016/en.tar.gz
$ tar zxvf en.tar.gz
แยกชุดการฝึกอบรม การพัฒนา และการทดสอบออกจากข้อมูลคำบรรยายที่เก็บไว้
$ make_trial_data.sh
หมายเหตุ: ข้อมูลที่แยกออกมาเป็นข้อมูลทดลองในขณะนี้
รันระบบพื้นฐาน (ไม่จำเป็น)
$ cd ../../ChatbotBaseline/egs/opensubs
$ run.sh
(ดู ChatbotBaseline/README.md
)
คุณสามารถรับข้อมูลอัปเดตล่าสุดและเข้าร่วมการสนทนาในรายชื่อผู้รับจดหมาย DSTC
หากต้องการเข้าร่วมรายชื่อผู้รับอีเมล ให้ส่งอีเมลไปที่: ([email protected]) ใส่ "subscribe DSTC" ในเนื้อความของข้อความ (โดยไม่ต้องใส่เครื่องหมายคำพูด) หากต้องการโพสต์ข้อความ ให้ส่งข้อความของคุณไปที่: ([email protected])