เป้าหมายของเส้นทางนี้คือการตั้งค่างานแชทที่ใช้งานอยู่ตามกราฟความรู้ ที่อยู่เว็บไซต์อย่างเป็นทางการของบทสนทนาที่ขับเคลื่อนด้วยความรู้
เป้าหมายการสนทนา g โดยที่ g=START->TOPIC_A->TOPIC_B; หมายความว่าเครื่องกำลังสนทนาตั้งแต่สถานะ Cold Start ถึงหัวข้อ A จากนั้นจึงไปที่หัวข้อ B ซึ่งหมายความว่าในงานนี้ เครื่องจะแนะนำการสนทนา ในงานนี้ หัวข้อเฉพาะจะรวมถึงภาพยนตร์และตัวละครบันเทิง
ข้อมูลความรู้ที่เกี่ยวข้อง M โดยที่ M=f1, f2,...,fn ประกอบด้วยสามประเภท ได้แก่ ข้อมูลความรู้ของหัวข้อ A ข้อมูลความรู้ของหัวข้อ B และข้อมูลที่เกี่ยวข้องของหัวข้อ A และหัวข้อ B ในงานนี้ ข้อมูลความรู้ที่เกี่ยวข้องเฉพาะ ได้แก่ บ็อกซ์ออฟฟิศภาพยนตร์ ผู้กำกับ และการประเมินผล ฯลฯ ซึ่งแสดงในรูปแบบของ SPO นั่นคือ (ประธาน ภาคแสดง วัตถุ) นั่นคือ (เอนทิตีหนึ่ง ภาคแสดง เอนทิตีที่สอง)
ลำดับบทสนทนาปัจจุบัน H=u1,u2,...u(t-1)
เครื่องตอบกลับ ut.
การผสมผสานระหว่างตัวบ่งชี้การประเมินอัตโนมัติและตัวบ่งชี้การประเมินด้วยตนเอง ดัชนีการประเมินอัตโนมัติจะพิจารณาการวัดสามระดับ ได้แก่ ระดับอักขระ (คะแนน F1) ระดับคำ (BLEU) และความหลากหลายของการตอบกลับ (DISTINCT) ในส่วนของความหลากหลายของคำตอบนั้นยังคงขึ้นอยู่กับการคำนวณคำ แต่จะตรวจสอบอีกมิติหนึ่งของคำที่สร้างขึ้น ในเอกสารอ้างอิงที่ 2 ผู้เขียนเขียนว่า:
แตกต่าง-1 และ แตกต่าง-2 คือจำนวนของยูนิแกรมและบิ๊กแกรมที่แตกต่างกันหารด้วยจำนวนคำที่สร้างขึ้นทั้งหมดตามลำดับ
อ้างถึงบทช่วยสอนที่จัดทำอย่างเป็นทางการโดย PyTorch (ดูอ้างอิง 4) วิธีการแก้ปัญหาจากมุมมองของ seq2seq คือการแบ่งบทสนทนาหลายรอบออกเป็นประโยคคู่ขนาน ตัวอย่างเช่น ลำดับบทสนทนาปัจจุบัน H=u1,u2,...u(t-1) สามารถแบ่งออกเป็นกลุ่มตัวอย่าง t-2 ได้ ซึ่งได้แก่: u1->u2;u2->u3;...; u (t-2)->u(t-1); อย่างไรก็ตาม มีปัญหาที่ชัดเจนกับวิธีการหารนี้: ความราบรื่นระหว่างประโยค นี่ควรเป็นคำถาม แต่ฉันไม่ได้คิดอย่างลึกซึ้ง
ปัจจุบัน รหัสการสอนของ Chatbot อย่างเป็นทางการของ PyTorch ได้รับการปรับโครงสร้างใหม่ แต่ละโมดูลได้รับการแยกส่วน และพบข้อบกพร่องแล้ว บนพื้นฐานนี้ เตรียมที่จะใช้บรรทัดฐาน ที่อยู่รหัส
สำหรับแนวคิดในการนำไปปฏิบัติ ส่วนใหญ่เราจะอ้างถึงรายงาน "แบบจำลองการสนทนาทางประสาทที่มีพื้นฐานมาจากความรู้" ซึ่งประกอบด้วยสองส่วนหลัก:
ขั้นแรก: วิธีฝังข้อมูลของกราฟความรู้ลงในแบบจำลอง
ประการที่สอง: การใช้กลไกหน่วยความจำ
เติมเงิน:
ส่วนที่ 3.2 ของบทความ IJCAI16 "การตอบคำถามเกี่ยวกับระบบประสาท" เสนอสองวิธีสำหรับการโต้ตอบระหว่างอินพุตและ KG:
ครั้งแรก: โมเดล Bilinear
ประการที่สอง: โมเดลการจับคู่ตาม CNN
อ้างถึง:
0.www2018,《DKN: เครือข่ายความรู้เชิงลึกสำหรับการแนะนำข่าวสาร》
1. การประชุมการประมวลผลโซเชียลมีเดียแห่งชาติครั้งที่ 6-SMP2017 การประเมินเทคโนโลยีการสนทนาระหว่างมนุษย์และคอมพิวเตอร์ของจีน (ECDT)
ประกอบด้วยสองงาน: การจำแนกโดเมนความตั้งใจของผู้ใช้และการประเมินออนไลน์บทสนทนาระหว่างมนุษย์และคอมพิวเตอร์ตามงานเฉพาะโดเมน
2.《ฟังก์ชั่นวัตถุประสงค์ที่ส่งเสริมความหลากหลายสำหรับโมเดลการสนทนาทางประสาท》
3.《โมเดลการสนทนาทางประสาทตามบุคคล》
4. บทช่วยสอนแชทบอทด้วย pytorch
5.2018 แผนรองชนะเลิศการแข่งขันเสวนา JDDC
6. เครื่องจักรสามารถคาดเดาสิ่งที่คุณกำลังคิดได้อย่างไร? แพลตฟอร์มทำนายของ Alibaba Xiaomi ถูกถอดรหัสแล้ว
7. แยกชิ้นส่วนหลักของ Alibaba Xiaomi และดูตรรกะการใช้งานของการโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์อันชาญฉลาด
8. เผยความลับในบทความเดียว! กระบวนการทั้งหมดในการสร้างกราฟความรู้จากล่างขึ้นบน
9. กราฟความรู้สร้างขึ้นเพื่อตอบสนองความต้องการของผู้ใช้อีคอมเมิร์ซอย่างไร
10. วิศวกรของ Alibaba จะนำแผนที่ความรู้ด้านสุขภาพไปใช้อย่างไร