เมื่อเร็วๆ นี้ ยักษ์ใหญ่ในด้านปัญญาประดิษฐ์ได้วางแผนและดำเนินการในการเก็บข้อมูลและความร่วมมือทางเทคนิคบ่อยครั้ง บทความนี้จะเน้นไปที่ข่าวสำคัญหลายประการและวิเคราะห์ผลกระทบต่อการพัฒนาและแนวโน้มในอนาคตของอุตสาหกรรมปัญญาประดิษฐ์ ข่าวดังกล่าวเกี่ยวข้องกับข้อตกลงมหาศาลของ Reddit กับ Google และความร่วมมือเชิงลึกของ OpenAI กับองค์กรสำนักพิมพ์หลายแห่ง แสดงให้เห็นถึงความต้องการข้อมูลคุณภาพสูงสำหรับการฝึกอบรมโมเดลขนาดใหญ่และบทบาทสำคัญของอุตสาหกรรมการพิมพ์ในนั้น ความร่วมมือเหล่านี้ไม่เพียงแต่เป็นแรงผลักดันใหม่สำหรับการพัฒนาปัญญาประดิษฐ์เท่านั้น แต่ยังบ่งชี้ว่าการได้มาและการใช้ทรัพยากรข้อมูลจะมีมาตรฐานและเป็นเชิงพาณิชย์มากขึ้นในอนาคต
Reddit และ Google มีข้อตกลงมูลค่าประมาณ 60 ล้านดอลลาร์ต่อปี ตามที่ผู้คนคุ้นเคยกับเรื่องนี้ Springer Publishing Group ร่วมมือกับ OpenAI เพื่อเป็นองค์กรสำนักพิมพ์แห่งแรกที่บูรณาการงานข่าวและเทคโนโลยีปัญญาประดิษฐ์อย่างลึกซึ้ง การทำงานร่วมกันของ OpenAI กับ Axel Springer แสดงให้เห็นว่าการฝึกอบรมโมเดลขนาดใหญ่อาจต้องเสียค่าใช้จ่ายในการเข้าถึงข้อมูล บริษัทในอุตสาหกรรมการพิมพ์มีทรัพยากรกราฟิกและข้อความอิเล็กทรอนิกส์มากมาย ซึ่งอาจกลายเป็นชุดข้อมูลการฝึกอบรมโมเดลขนาดใหญ่ที่สำคัญ CITIC Publishing พยายามร่วมมือกับนักเขียนและบริษัทต้นแบบขนาดใหญ่สำหรับการฝึกอบรมภาษา และ Palm Reading Technology กำลังดำเนินการร่วมมือเชิงลึกกับ Byte ในด้านต่างๆ เช่น ลิขสิทธิ์และการผลิตเนื้อหาจากกรณีข้างต้น จะเห็นได้ว่าอุตสาหกรรมปัญญาประดิษฐ์กำลังอยู่ในช่วงของการพัฒนาอย่างรวดเร็ว และการแข่งขันด้านทรัพยากรข้อมูลก็รุนแรงมากขึ้น ในอนาคต วิธีการรับและใช้งานข้อมูลจะมีการเปลี่ยนแปลงอย่างมาก ซึ่งจะ ยังนำโอกาสและความท้าทายใหม่ ๆ มาสู่อุตสาหกรรมการพิมพ์