จีน-ChatBot/แชทบอทจีน
- ผู้เขียนได้โอนเรียบร้อยแล้วที่
ทิศทางโครงข่ายประสาทเทียมกราฟ GNN การพัฒนา C++ จะไม่ติดตาม NLP อีกต่อไป และรหัสโครงการจะยุติการรักษาไว้ เมื่อโครงการ Yuanxiang เสร็จสิ้น มีแหล่งข้อมูลออนไลน์น้อยมาก ผู้เขียนได้ติดต่อกับ NLP และ Deep Learning เป็นครั้งแรกด้วยความตั้งใจที่จะเอาชนะความยากลำบากมากมาย ในที่สุดเขาก็เขียนโมเดลของเล่นนี้ขึ้นมา ดังนั้น ผู้เขียนรู้ดีว่าไม่ใช่เรื่องง่ายสำหรับผู้เริ่มต้น ดังนั้นแม้ว่าโครงการจะไม่ได้รับการดูแลอีกต่อไป ปัญหาหรืออีเมล ([email protected]) จะได้รับการตอบกลับอย่างทันท่วงทีเพื่อช่วยเหลือผู้มาใหม่ใน Deep Learning (เวอร์ชันของ Tensorflow ที่ฉันใช้เก่าเกินไป หากคุณเรียกใช้เวอร์ชันใหม่โดยตรง คุณจะได้รับข้อผิดพลาดต่างๆ อย่างแน่นอน หากคุณพบปัญหา ไม่ต้องกังวลกับการติดตั้งเวอร์ชันเก่าของสภาพแวดล้อม แนะนำให้ใช้ Pytorch เพื่อสร้างใหม่ตามตรรกะการประมวลผลของฉัน ฉันขี้เกียจเกินไปที่จะเขียน)
- แง่มุม GNN:
- ชุดของแบบจำลองการเปรียบเทียบเกณฑ์มาตรฐาน: GNNs-Baseline ได้รับการดัดแปลงและเรียบเรียงเพื่ออำนวยความสะดวกในการตรวจสอบแนวคิดอย่างรวดเร็ว
- โค้ดโอเพ่นซอร์สของเอกสาร ACMMM 2023 (CCF-A) ของฉันอยู่ที่นี่ LSTGM
- โค้ดโอเพ่นซอร์สของเอกสาร ICDM 2023 (CCF-B) ของฉันยังคงถูกรวบรวม - - จีอาร์เอ็น
- เพื่อนๆ สามารถเพิ่ม สื่อสาร และเรียนรู้ได้
การกำหนดค่าสภาพแวดล้อม
โปรแกรม | เวอร์ชัน |
---|
หลาม | 3.68 |
เทนเซอร์โฟลว์ | 1.13.1 |
เคราส | 2.2.4 |
windows10 | |
จูปีเตอร์ | |
วัสดุอ้างอิงหลัก
- วิทยานิพนธ์ "การแปลด้วยเครื่องนิวรัลโดยร่วมเรียนรู้การจัดตำแหน่งและการแปล ( คลิกที่ชื่อเพื่อดาวน์โหลด )"
- แผนภาพโครงสร้างความสนใจ
ประเด็นสำคัญ
- แอลเอสทีเอ็ม
- seq2seq
- การทดลองให้ความสนใจแสดงให้เห็นว่าหลังจากเพิ่มกลไกความสนใจแล้ว ความเร็วในการฝึกจะเร็วขึ้น การบรรจบกันเร็วขึ้น และผลที่ได้ก็ดีขึ้น
คอร์ปัสและสภาพแวดล้อมการฝึกอบรม
กลุ่มบทสนทนา 100,000 กลุ่มจากคลังข้อมูล Qingyun ที่ได้รับการฝึกอบรมในการทำงานร่วมกันของ Google
วิ่ง
วิธีที่ 1: กระบวนการเสร็จสมบูรณ์
- การประมวลผลข้อมูลล่วงหน้า
get_data
- การฝึกอบรมแบบจำลอง
chatbot_train
(นี่คือเวอร์ชันที่ติดตั้งกับ google colab เส้นทางการวิ่งในเครื่องจำเป็นต้องแก้ไขเล็กน้อย)
- การทำนายแบบจำลอง
chatbot_inference_Attention
วิธีที่ 2: โหลดโมเดลที่มีอยู่
- เรียกใช้
chatbot_inference_Attention
- โหลด
models/W--184-0.5949-.h5
อินเทอร์เฟซ (Tkinter)
การแสดงภาพน้ำหนักความสนใจ
อื่น
- ในไฟล์การฝึกอบรม chat_bot โค้ดสองชุดแรกจากสามบล็อกสุดท้ายถูกใช้เพื่อเมานต์ Google Cloud Disk และอันสุดท้ายถูกใช้เพื่อรับการสูญเสียเหล่านั้นเพื่ออำนวยความสะดวกในการวาด ฉันไม่รู้ว่าทำไม tensorbord ในฟังก์ชันโทรกลับ ใช้งานไม่ได้ ดังนั้นฉันจึงคิดกลยุทธ์นี้ขึ้นมา
- บล็อกสุดท้ายของโค้ดในไฟล์การทำนายมีเพียงการป้อนข้อความ แต่ไม่มีอินเทอร์เฟซ บล็อกสุดท้ายของโค้ดคืออินเทอร์เฟซหนึ่งในสองบล็อกที่สามารถรันได้ทันทีตามความต้องการ
- มีเอาต์พุตระดับกลางมากมายในโค้ด ฉันหวังว่ามันจะช่วยให้คุณเข้าใจโค้ดได้
- มีโมเดลที่ผมได้ฝึกไว้แล้วในการใช้งานปกติก็ไม่น่าจะมีปัญหาอะไร
- ผู้เขียนมีความสามารถจำกัดและไม่พบตัวบ่งชี้ที่จะวัดผลของบทสนทนา ดังนั้นการสูญเสียสามารถสะท้อนถึงความคืบหน้าของการฝึกอบรมได้คร่าวๆ เท่านั้น