มหาวิทยาลัยปิก้าและปักกิ่ง และมหาวิทยาลัยสแตนฟอร์ดได้เปิดซอร์สเฟรมเวิร์กโมเดลการแพร่กระจายใหม่ที่เรียกว่า RPG ซึ่งใช้เทคโนโลยีโมเดลภาษาขนาดใหญ่ (LLM) อย่างชาญฉลาด เพื่อเพิ่มความสามารถของโมเดลการแพร่กระจายในการทำความเข้าใจและประมวลผลคำพร้อมท์ที่ซับซ้อน เทคโนโลยีที่ก้าวล้ำนี้ช่วยให้ภาพที่สร้างขึ้นตรงกับข้อกำหนดคำที่ผู้ใช้กำหนดไว้ได้แม่นยำยิ่งขึ้น และเอฟเฟกต์ยังเหนือกว่า Dall·E 3 ที่ได้รับรางวัลอีกด้วย ข่าวนี้จุดประกายให้เกิดการถกเถียงกันอย่างดุเดือดบนอินเทอร์เน็ตทันทีที่มีการเผยแพร่ นักวิจัยที่เกี่ยวข้องในโครงการนี้มาจากมหาวิทยาลัยปักกิ่ง มหาวิทยาลัยสแตนฟอร์ด และทีมผู้ก่อตั้ง Pika เทคโนโลยีนี้นำความเป็นไปได้ใหม่มาสู่สาขาการสร้างภาพปัญญาประดิษฐ์ ให้เรารอดูการพัฒนาในอนาคต
Pika ร่วมมือกับมหาวิทยาลัยปักกิ่งและมหาวิทยาลัยสแตนฟอร์ดเพื่อเปิดเฟรมเวิร์ก RPG แบบโอเพ่นซอร์ส โดยใช้เทคโนโลยี LLM เพื่อปรับปรุงความสามารถของโมเดลการแพร่กระจายในการทำความเข้าใจคำพร้อมท์ที่ซับซ้อน และเอฟเฟกต์เกิน Dall·E 3 กรอบงานสามารถสร้างภาพที่ตรงตามข้อกำหนดคำที่รวดเร็วกว่า และทำให้เกิดการอภิปรายอย่างดุเดือดทางออนไลน์ ผู้เขียนที่เข้าร่วมมาจากมหาวิทยาลัยปักกิ่ง สแตนฟอร์ด และผู้ร่วมก่อตั้ง Pika กรุณาเยี่ยมชมลิงค์ต้นฉบับเพื่อดูรายละเอียด
โอเพ่นซอร์สของเฟรมเวิร์ก RPG ถือเป็นก้าวสำคัญในเทคโนโลยีการสร้างภาพปัญญาประดิษฐ์ ช่วยให้นักพัฒนาและนักวิจัยมีเครื่องมือใหม่อันทรงพลัง ในอนาคต เราสามารถตั้งตารอที่จะมีแอปพลิเคชันที่เป็นนวัตกรรมมากขึ้นซึ่งใช้เทคโนโลยี LLM ซึ่งจะทำให้เราได้รับประสบการณ์การสร้างภาพ AI ที่น่าทึ่งยิ่งขึ้น