โมเดล AI ล่าสุดของ Stability AI คือ Stable Zero123 สามารถสร้างมุมมองวัตถุ 3 มิติคุณภาพสูงจากภาพเดียวได้ และประสิทธิภาพการทำงานก็เหนือกว่า Zero123-XL รุ่นก่อนหน้าอย่างเห็นได้ชัด การปรับปรุงโมเดลนี้สะท้อนให้เห็นเป็นหลักใน 3 ด้าน ได้แก่ ชุดข้อมูลการฝึกอบรมที่ได้รับการปรับปรุง เทคโนโลยี "เงื่อนไขระดับสูง" ที่เป็นนวัตกรรม และกระบวนการฝึกอบรมที่มีประสิทธิภาพมากกว่า 40 เท่า Stable Zero123 ได้รับการเผยแพร่บนแพลตฟอร์ม Hugging Face และมีโมเดลลิขสิทธิ์ 2 รูปแบบ ได้แก่ เวอร์ชันวิจัยและเวอร์ชันเชิงพาณิชย์ ซึ่งนำความเป็นไปได้ใหม่ๆ มาสู่วงการการสร้างวัตถุ 3 มิติ บทความนี้จะอธิบายรายละเอียดเกี่ยวกับเทคโนโลยีหลักและแนวโน้มการใช้งานของ Stable Zero123
Stability AI ได้เปิดตัวโมเดล AI ใหม่ที่เรียกว่า Stable Zero123 ซึ่งสามารถสร้างมุมมองวัตถุ 3 มิติคุณภาพสูงจากภาพเดียวได้ Zero123 ที่เสถียรมีประสิทธิภาพเหนือกว่า Zero123-XL รุ่นก่อนอย่างมากในผลลัพธ์ที่ได้ ต้องขอบคุณนวัตกรรมหลักสามประการ
Zero123 ที่เสถียรใช้ชุดข้อมูลการฝึกอบรมที่เลือกสรรมาอย่างเข้มงวดจาก Objaverse ที่จะเก็บรักษาวัตถุ 3D คุณภาพสูงโดยเฉพาะ การปรับปรุงนี้ช่วยให้แน่ใจว่าวัตถุ 3 มิติที่สร้างขึ้นมีความสมจริงมากขึ้น
ในระหว่างกระบวนการฝึกอบรมและการอนุมานของแบบจำลอง Stable Zero123 จะใช้มุมกล้องโดยประมาณสำหรับ "การปรับระดับความสูง" เทคโนโลยีนี้ช่วยให้แบบจำลองสามารถคาดการณ์ได้แม่นยำยิ่งขึ้น และปรับปรุงคุณภาพของภาพที่สร้างขึ้นได้อย่างมาก Stable Zero123 ยังแนะนำชุดข้อมูลที่คำนวณล่วงหน้าและตัวโหลดข้อมูลที่ปรับปรุงใหม่ ทำให้การฝึกอบรมมีประสิทธิภาพมากขึ้น 40 เท่า
ขณะนี้ Stable Zero123 ได้รับการเผยแพร่บน Hugging Face เพื่อให้นักวิจัยและผู้ใช้ที่ไม่ใช่เชิงพาณิชย์ได้ดาวน์โหลดและทดลอง ควรสังเกตว่าการใช้รุ่นนี้อยู่ภายใต้ข้อจำกัดในการอนุญาตบางประการ และแบ่งออกเป็นสองเวอร์ชัน: Stable Zero123 และ Stable Zero123C แบบแรกประกอบด้วยวัตถุ 3 มิติที่ได้รับอนุญาตจาก CC-BY-NC และสามารถใช้เพื่อวัตถุประสงค์ในการวิจัยเท่านั้น ส่วนแบบหลังใช้เฉพาะวัตถุที่ได้รับอนุญาตจาก CC-BY และ CC0 เท่านั้น ซึ่งอนุญาตให้ผู้ใช้ที่เป็นสมาชิก Stability AI สามารถใช้ในเชิงพาณิชย์ได้
นอกจากนี้ Stable Zero123 ยังรวมเข้ากับโค้ดโอเพ่นซอร์ส threestudio เพื่อรองรับการวิจัยโอเพ่นซอร์สเกี่ยวกับการสร้างวัตถุ 3 มิติ ปัจจุบัน กระบวนการ Stable3D เวอร์ชันเรียบง่ายที่เกี่ยวข้องอยู่ในการแสดงตัวอย่างแบบส่วนตัว ด้วยแนวทางนี้ ผู้ใช้สามารถใช้ Score Distillation Sampling (SDS) เพื่อเพิ่มประสิทธิภาพสนามรังสีประสาท (NeRF) เพื่อสร้างโมเดล 3 มิติที่มีพื้นผิวสมบูรณ์จากรูปภาพที่สร้างโดยโมเดล Stable Zero123
การเปิดตัว Stable Zero123 ไม่เพียงแต่นำความก้าวหน้าทางเทคโนโลยีที่สำคัญมาสู่สาขาการสร้างวัตถุ 3 มิติเท่านั้น แต่ยังมอบความเป็นไปได้ใหม่ๆ สำหรับการวิจัยและการใช้งานเชิงพาณิชย์อีกด้วย
บล็อกอย่างเป็นทางการ: https://stability.ai/news/stable-zero123-3d-model
ไฮไลท์:
Zero123 ที่เสถียรสามารถสร้างมุมมองวัตถุ 3 มิติคุณภาพสูงจากภาพเดียว ซึ่งช่วยปรับปรุงเอฟเฟกต์การสร้างได้อย่างมาก
โมเดลนี้ช่วยให้สามารถสร้างภาพได้แม่นยำยิ่งขึ้นผ่านชุดข้อมูลที่ได้รับการปรับปรุงและเทคนิคการปรับสภาพที่ยกระดับ
Stable Zero123 แบ่งออกเป็นเวอร์ชันวิจัยและเวอร์ชันเชิงพาณิชย์ โดยเวอร์ชันหลังจำเป็นต้องเป็นสมาชิก Stability AI
การเกิดขึ้นของ Stable Zero123 ถือเป็นการก้าวกระโดดครั้งสำคัญในเทคโนโลยีการสร้างโมเดล 3 มิติ กระบวนการฝึกอบรมที่มีประสิทธิภาพและเอฟเฟกต์การสร้างคุณภาพสูงทำให้มีความเป็นไปได้สำหรับสถานการณ์การใช้งานเพิ่มเติมในอนาคต .