ทีมวิจัยของ Google ได้เปิดตัว Alchemist ซึ่งเป็นเทคโนโลยีการแก้ไขภาพที่ล้ำสมัยที่ช่วยให้ผู้ใช้สามารถควบคุมคุณสมบัติของวัสดุของวัตถุในภาพ เช่น สี ความมันเงา และความโปร่งใสได้อย่างแม่นยำ โดยไม่จำเป็นต้องใช้ซอฟต์แวร์หรือทักษะระดับมืออาชีพ หัวใจหลักของ Alchemist คือโมเดลการสร้างข้อความเป็นรูปภาพที่ได้รับการปรับแต่งอย่างละเอียด ซึ่งสามารถควบคุมพารามิเตอร์วัสดุได้อย่างละเอียดโดยการสังเคราะห์ชุดข้อมูลและปรับเปลี่ยนสถาปัตยกรรมโมเดล Stable Diffusion 1.5 เทคโนโลยีนี้มีศักยภาพในการปฏิวัติกระบวนการแก้ไขภาพ โดยมอบเครื่องมืออันทรงพลังสำหรับมืออาชีพ เช่น นักออกแบบ ศิลปิน และสถาปนิก
ทีมวิจัยของ Google เพิ่งเปิดตัวเทคโนโลยีล้ำสมัย - Alchemist เทคโนโลยีนี้ช่วยให้ผู้ใช้แก้ไขคุณสมบัติของวัสดุของรายการในรูปภาพ เช่น สี ความมันเงา และความโปร่งใสได้อย่างแม่นยำ โดยไม่จำเป็นต้องใช้ซอฟต์แวร์และทักษะการแก้ไขภาพระดับมืออาชีพ
หัวใจสำคัญของเทคโนโลยีของ Alchemist คือโมเดลการสร้างข้อความเป็นรูปภาพ (T2I) ที่ได้รับการปรับแต่งอย่างละเอียด ทีมวิจัยประสบความสำเร็จในการควบคุมพารามิเตอร์ของวัสดุอย่างละเอียดโดยการสร้างชุดข้อมูลสังเคราะห์และปรับเปลี่ยนสถาปัตยกรรมแบบจำลอง Stable Diffusion1.5
โดยเฉพาะอย่างยิ่ง นักวิจัยได้สร้างภาพสังเคราะห์จำนวนมากขึ้นเป็นครั้งแรกโดยใช้คอมพิวเตอร์กราฟิกและเทคนิคการเรนเดอร์ตามลักษณะทางกายภาพ รูปภาพเหล่านี้ประกอบด้วยโมเดล 3 มิติที่หลากหลายพร้อมวัสดุ มุมกล้อง และสภาพแสงที่เลือกแบบสุ่ม จากนั้นพวกเขาจึงทำการเปลี่ยนแปลงคุณลักษณะเดี่ยวๆ ของรูปภาพเหล่านี้ โดยสร้างหลายเวอร์ชันซึ่งมีจุดเด่นในการแก้ไขที่แตกต่างกัน
ด้วยการปรับแต่งข้อมูลสังเคราะห์นี้อย่างละเอียด แบบจำลองจะเรียนรู้วิธีการเปลี่ยนแปลงเฉพาะคุณสมบัติของวัสดุที่ระบุ รูปภาพบริบท คำแนะนำ และแก้ไขค่าความเข้ม ในขณะเดียวกันก็รักษารูปร่างของรายการและแสงของภาพไว้ไม่เปลี่ยนแปลง
ผลการทดลองแสดงให้เห็นว่าเทคโนโลยีนี้สามารถเปลี่ยนรูปลักษณ์ของวัตถุได้อย่างมีประสิทธิภาพ เช่น เพิ่มความรู้สึกของโลหะหรือปรับความโปร่งใส ในการศึกษาผู้ใช้ วิธีการนี้ได้รับข้อได้เปรียบที่สำคัญทั้งในด้านความสมจริงของแสงและความชอบของผู้ใช้ เมื่อเปรียบเทียบกับแนวทางพื้นฐาน
โอกาสในการประยุกต์ใช้เทคโนโลยีนี้มีมากมาย ช่วยให้นักออกแบบตกแต่งภายในดูตัวอย่างว่าห้องจะมีลักษณะอย่างไรเมื่อทาสีใหม่ หรือช่วยสถาปนิก ศิลปิน และนักออกแบบในการสร้างแบบร่างการออกแบบสำหรับผลิตภัณฑ์ใหม่ได้อย่างรวดเร็ว นอกจากนี้ เนื่องจากเอฟเฟกต์การแก้ไขมีความสอดคล้องกันในการมองเห็น เทคโนโลยีนี้จึงสามารถนำไปใช้สำหรับงาน 3D ดาวน์สตรีม เช่น การสร้าง NeRF (Neural Radiation Field) ขึ้นมาใหม่
แม้ว่าเทคโนโลยี Alchemist จะมีความก้าวหน้าอย่างมากในการแก้ไขเนื้อหา แต่ทีมวิจัยยังชี้ให้เห็นถึงข้อจำกัดบางประการด้วย ตัวอย่างเช่น โมเดลยังคงมีพื้นที่สำหรับการปรับปรุงในการจัดการรายละเอียดที่ซ่อนอยู่ในรูปภาพ
อย่างไรก็ตาม นักวิจัยมั่นใจในศักยภาพของเทคโนโลยีในการควบคุมการแก้ไขเนื้อหา ด้วยการวิจัยและการเพิ่มประสิทธิภาพเพิ่มเติม Alchemist คาดว่าจะปฏิวัติวงการการแก้ไขภาพ ทำให้งานการแก้ไขวัสดุที่ซับซ้อนง่ายขึ้นและใช้งานง่ายยิ่งขึ้น
เทคโนโลยี Alchemist ของ Google ถือเป็นความก้าวหน้าครั้งสำคัญอีกประการหนึ่งของปัญญาประดิษฐ์ในด้านการประมวลผลภาพ ไม่เพียงแต่ทำให้กระบวนการแก้ไขภาพที่ซับซ้อนง่ายขึ้น แต่ยังมอบความเป็นไปได้ใหม่ๆ ให้กับอุตสาหกรรมสร้างสรรค์ และคาดว่าจะมีผลกระทบอย่างลึกซึ้งในหลายสาขา เช่น การออกแบบ ศิลปะ และความเป็นจริงเสมือน
ที่อยู่โครงการ: https://prafullsharma.net/alchemist/
การเกิดขึ้นของเทคโนโลยี Alchemist ถือเป็นอีกก้าวสำคัญในด้านปัญญาประดิษฐ์ในการแก้ไขภาพ ความสามารถในการแก้ไขเนื้อหาที่มีประสิทธิภาพและแม่นยำจะนำพลังใหม่มาสู่อุตสาหกรรมสร้างสรรค์อย่างแน่นอน และส่งเสริมการพัฒนาและนวัตกรรมอย่างต่อเนื่องของเทคโนโลยีที่เกี่ยวข้อง