ปัจจุบัน ด้วยการพัฒนาอย่างรวดเร็วของเทคโนโลยี AI ประสบการณ์ส่วนบุคคลจึงกลายเป็นจุดสนใจของผู้ใช้ วิธีทำให้ AI เข้าใจความต้องการของผู้ใช้อย่างแท้จริงและให้บริการที่ปรับแต่งได้กลายมาเป็นความท้าทายที่สำคัญในด้านปัญญาประดิษฐ์ เทคโนโลยี PMG (Personalized Multimodal Generation) ที่พัฒนาโดย Huawei และมหาวิทยาลัย Tsinghua ทำให้เกิดแนวคิดใหม่ในการแก้ปัญหานี้ เทคโนโลยีนี้สามารถสร้างเนื้อหาส่วนบุคคลหลายรูปแบบตามพฤติกรรมและความชอบในอดีตของผู้ใช้ เช่น อีโมติคอน การออกแบบเสื้อยืด และโปสเตอร์ภาพยนตร์ ทำให้ผู้ใช้ได้รับประสบการณ์ AI ที่รอบคอบและสะดวกสบายมากขึ้น
ในยุคนี้ที่ Personalization เป็นสิ่งสำคัญยิ่ง AI จะเข้าใจคุณได้ดีขึ้นได้อย่างไร ลองนึกภาพว่าเมื่อคุณพิมพ์ว่า "ฉันผ่านแล้ว ฉันมีความสุขมาก!" ในซอฟต์แวร์แชท AI ที่เข้าใจความคิดของคุณไม่เพียงแต่รับรู้ถึงความตื่นเต้นของคุณเท่านั้น แต่ยังจดจำได้อีกด้วย ว่าคุณชอบรูปหน้าแมวยิ้ม ดังนั้นจึงได้สร้างชุดชุดรูปหน้าแมวยิ้มเฉพาะตัวที่ออกแบบมาเพื่อคุณโดยเฉพาะ
ในด้านปัญญาประดิษฐ์ส่วนบุคคล Huawei และมหาวิทยาลัย Tsinghua ได้ร่วมมือกันสร้างเทคโนโลยีใหม่ที่เรียกว่า PMG (Personalized Multimodal Generation) เทคโนโลยีนี้สามารถสร้างเนื้อหาหลายรูปแบบที่ตรงกับความต้องการส่วนบุคคลของผู้ใช้ โดยพิจารณาจากพฤติกรรมและความชอบในอดีตของผู้ใช้ เช่น อีโมติคอน การออกแบบเสื้อยืด โปสเตอร์ภาพยนตร์ เป็นต้น
PMG ทำงานอย่างไร แยกการตั้งค่าของผู้ใช้โดยการวิเคราะห์ประวัติการเข้าชมและการสนทนาของผู้ใช้ รวมกับความสามารถในการให้เหตุผลของโมเดลภาษาขนาดใหญ่ กระบวนการนี้รวมถึงการสร้างคำสำคัญที่ชัดเจนและการสร้างเวกเตอร์การตั้งค่าผู้ใช้โดยนัย การรวมกันของทั้งสองเป็นพื้นฐานข้อมูลที่สมบูรณ์สำหรับการสร้างเนื้อหาหลายรูปแบบ
ในการใช้งานจริง เทคโนโลยี PMG สามารถบรรลุฟังก์ชันต่อไปนี้:
การสร้างคีย์เวิร์ด: สร้างคำพร้อมท์เพื่อเป็นแนวทางในโมเดลขนาดใหญ่เพื่อแยกการตั้งค่าของผู้ใช้เป็นคีย์เวิร์ด
การสร้างเวกเตอร์ที่ซ่อนอยู่: การรวมคีย์เวิร์ดที่ผู้ใช้กำหนดไว้และคีย์เวิร์ดของรายการเป้าหมาย โดยใช้โมเดลขนาดใหญ่สำหรับการแก้ไขอคติที่ปรับแต่งอย่างละเอียดโดย P-Tuning V2 เพื่อเรียนรู้ความสามารถในการสร้างหลายรูปแบบ
สมดุลระหว่างความชอบของผู้ใช้และรายการเป้าหมาย: โดยการคำนวณระดับความเป็นส่วนตัวและความแม่นยำ การวัดผลในเชิงปริมาณ และการปรับเนื้อหาที่สร้างขึ้นให้เหมาะสม
ทีมวิจัยตรวจสอบประสิทธิภาพของเทคโนโลยี PMG ผ่านสถานการณ์การใช้งาน 3 รูปแบบ ได้แก่ การสร้างภาพเสื้อผ้าอีคอมเมิร์ซ ฉากโปสเตอร์ภาพยนตร์ และการสร้างการแสดงออก ผลการทดลองแสดงให้เห็นว่า PMG สามารถสร้างเนื้อหาส่วนบุคคลที่สะท้อนถึงความต้องการของผู้ใช้ และทำงานได้ดีกับตัวบ่งชี้ความคล้ายคลึงกันของรูปภาพ LPIPS และ SSIM
เทคโนโลยีนี้ไม่เพียงแต่เป็นนวัตกรรมทางทฤษฎีเท่านั้น แต่ยังแสดงให้เห็นถึงศักยภาพและมูลค่าเชิงพาณิชย์ในการใช้งานจริงอีกด้วย ด้วยความต้องการส่วนบุคคลที่เพิ่มขึ้น เทคโนโลยี PMG คาดว่าจะเติบโตอย่างรวดเร็วในอนาคต ทำให้ผู้ใช้ได้รับประสบการณ์ที่สมบูรณ์และเป็นส่วนตัวมากขึ้น
ที่อยู่โครงการ: https://github.com/mindspore-lab/models/tree/master/research/huawei-noah/PMG
โดยรวมแล้ว เทคโนโลยี PMG ประสบความสำเร็จในการสร้างเนื้อหาที่เป็นส่วนตัวสูงโดยการรวมโมเดลภาษาขนาดใหญ่และความสามารถในการสร้างหลายรูปแบบ ทำให้ผู้ใช้ได้รับประสบการณ์ AI ที่สร้างสรรค์มากขึ้นซึ่งใกล้เคียงกับความต้องการของพวกเขามากขึ้น มีแนวโน้มการใช้งานที่กว้างขวางในด้านอีคอมเมิร์ซ ความบันเทิง และสาขาอื่นๆ และคุ้มค่าที่จะรอคอยการพัฒนาและการใช้งานในอนาคต