เมื่อเร็ว ๆ นี้ Elon Musk แสดงความกังวลเกี่ยวกับการสูญเสียข้อมูลการฝึกอบรมปัญญาประดิษฐ์ในการถ่ายทอดสด เขาเชื่อว่าข้อมูลที่ใช้ในการฝึกอบรมโมเดล AI ในโลกแห่งความเป็นจริงนั้นใกล้จะหมดลงแล้ว มุมมองนี้สะท้อนมุมมองของผู้เชี่ยวชาญคนอื่นๆ ในสาขา AI ซึ่งกระตุ้นให้เกิดความคิดของอุตสาหกรรมเกี่ยวกับโมเดลการพัฒนา AI ในอนาคต Musk เชื่อว่าข้อมูลสังเคราะห์จะเป็นวิธีแก้ปัญหาสำคัญในปัญหาการขาดแคลนข้อมูล โดยสังเกตว่าบริษัทเทคโนโลยีหลายแห่งเริ่มนำแนวทางนี้ไปใช้ ซึ่งจะมีผลกระทบอย่างมากต่อวิธีการและค่าใช้จ่ายในการฝึกอบรมโมเดล AI
ในการสนทนาถ่ายทอดสดเมื่อเร็วๆ นี้ Elon Musk ซีอีโอของ Tesla และ SpaceX กล่าวว่าข้อมูลในโลกแห่งความเป็นจริงสำหรับการฝึกอบรมโมเดลปัญญาประดิษฐ์นั้นเกือบจะหมดลงแล้ว คนที่พูดคุยกับเขาคือ Mark Payne ประธานคณะกรรมการบริหารของ Stagwell มัสก์กล่าวว่า "โดยพื้นฐานแล้ว เราได้ใช้ความรู้ของมนุษย์ที่สั่งสมมาทั้งหมดแล้ว...ข้อมูลที่ใช้สำหรับการฝึกอบรมปัญญาประดิษฐ์ ปรากฏการณ์นี้โดยพื้นฐานแล้วเกิดขึ้นในปีที่แล้ว"
มุมมองของ Musk นั้นคล้ายคลึงกับทฤษฎี "Data Peak" ที่เสนอโดย Ilya Sutskov อดีตหัวหน้านักวิทยาศาสตร์ของ OpenAI ในการประชุม NeurIPS เมื่อเดือนธันวาคมปีที่แล้ว Suzkofer กล่าวว่าอุตสาหกรรม AI กำลังเผชิญกับความท้าทายจากการขาดแคลนข้อมูล และการขาดข้อมูลการฝึกอบรมที่เพียงพอในอนาคต จะส่งผลให้วิธีการพัฒนาโมเดล AI มีการเปลี่ยนแปลง
เพื่อแก้ไขปัญหานี้ Musk เชื่อว่าข้อมูลสังเคราะห์จะกลายเป็นทางเลือกที่ใช้การได้ เขาชี้ให้เห็นว่าวิธีเดียวที่จะเสริมข้อมูลในโลกแห่งความเป็นจริงได้คือผ่านข้อมูลสังเคราะห์ โดยที่ AI จะสร้างข้อมูลการฝึกของตัวเอง Musk กล่าวว่า AI สามารถปรับปรุงประสิทธิภาพได้ด้วยการประเมินตนเองและเพิ่มประสิทธิภาพตัวเองอย่างต่อเนื่อง
ปัจจุบัน บริษัทเทคโนโลยีหลายแห่ง เช่น Microsoft, Meta, OpenAI และ Anthropic ได้เริ่มใช้ข้อมูลสังเคราะห์เพื่อฝึกโมเดล AI หลักของตน Gartner คาดการณ์ว่าภายในปี 2567 ข้อมูลที่ใช้ในโครงการปัญญาประดิษฐ์และการวิเคราะห์ข้อมูล 60% จะถูกสร้างขึ้นแบบสังเคราะห์
ข้อได้เปรียบที่สำคัญของข้อมูลสังเคราะห์คือสามารถลดต้นทุนการพัฒนาได้อย่างมาก อย่างไรก็ตาม Musk และผู้เชี่ยวชาญคนอื่นๆ ยังชี้ให้เห็นว่าข้อมูลสังเคราะห์ไม่ได้ปราศจากความเสี่ยง การวิจัยแสดงให้เห็นว่าข้อมูลสังเคราะห์อาจทำให้ประสิทธิภาพของโมเดลลดลง และผลลัพธ์อาจมีนวัตกรรมน้อยลงและอาจได้รับผลกระทบจากอคติ หากข้อมูลสังเคราะห์มีข้อจำกัด ผลลัพธ์ของแบบจำลองขั้นสุดท้ายก็จะประสบปัญหาเหล่านี้เช่นกัน
ไฮไลท์:
Musk กังวลว่าข้อมูลในโลกแห่งความเป็นจริงสำหรับการฝึกอบรม AI เกือบจะหมดลงแล้ว
ข้อมูลสังเคราะห์ถือเป็นโซลูชันที่สำคัญสำหรับอนาคต และบริษัทเทคโนโลยีหลายแห่งก็เริ่มนำข้อมูลดังกล่าวไปใช้แล้ว
การใช้ข้อมูลสังเคราะห์สามารถลดต้นทุนการพัฒนาได้อย่างมาก แต่ก็มีความเสี่ยงที่ประสิทธิภาพของโมเดลจะลดลงเช่นกัน
โดยรวมแล้ว ปัญหาการขาดแคลนข้อมูลการฝึกอบรมปัญญาประดิษฐ์กำลังใกล้เข้ามา แม้ว่าข้อมูลสังเคราะห์จะนำมาซึ่งโอกาสใหม่ๆ แต่ก็นำเสนอความท้าทายเช่นกัน ทิศทางในอนาคตของการพัฒนา AI จะขึ้นอยู่กับวิธีการใช้และปรับปรุงข้อมูลสังเคราะห์อย่างมีประสิทธิภาพ สร้างสมดุลระหว่างต้นทุนและความเสี่ยง และบรรลุความก้าวหน้าอย่างต่อเนื่องในเทคโนโลยี AI ในท้ายที่สุด