บทความนี้เผยให้เห็นถึงความรุนแรงของการแข่งขันภายในที่ Meta ในระหว่างการพัฒนา Llama3 และปัญหาลิขสิทธิ์ที่อาจเกิดขึ้น จากข้อมูลภายในที่ศาลเผยแพร่ เราจะเห็นได้ว่า Meta ได้พยายามอย่างยิ่งใหญ่เพื่อให้เหนือกว่า OpenAI และ Anthropic แม้กระทั่งรับความเสี่ยงในการใช้ข้อมูลการฝึกอบรมที่อาจมีปัญหาด้านลิขสิทธิ์ บทความนี้จะให้การวิเคราะห์โดยละเอียดเกี่ยวกับสถานการณ์การแข่งขันภายในของ Meta ทัศนคติต่อคู่แข่ง และผลความเสี่ยงทางกฎหมายและโอกาสในอนาคต
ใน Kadrey v. Meta หนึ่งในคดีลิขสิทธิ์ปัญญาประดิษฐ์ที่กำลังดำเนินอยู่ของ Meta ข้อมูลภายในที่ศาลเผยแพร่เผยให้เห็นถึงการแข่งขันที่รุนแรงของบริษัทและปัญหาลิขสิทธิ์ที่อาจเกิดขึ้นเมื่อพัฒนา Llama3 ผู้นำอาวุโสและนักวิจัยของ Meta พยายามอย่างเต็มที่เพื่อให้เหนือกว่าบริษัทอย่าง OpenAI และ Anthropic ในการพัฒนาโมเดล AI และถือว่า GPT-4 และ Claude เป็นมาตรฐานทองคำสำหรับความพยายามของพวกเขา
ความคิดการแข่งขันที่รุนแรง: Meta สาบานที่จะเอาชนะ OpenAI
Ahmad Al-Dahle รองประธานฝ่าย Generative AI ของ Meta กล่าวว่าเป้าหมายของบริษัทในการพัฒนา Llama3 นั้นมีเป้าหมายที่ชัดเจนที่ GPT-4 และมุ่งมั่นที่จะใช้ประโยชน์จากการแข่งขัน AI ผ่านการสนับสนุนฮาร์ดแวร์ที่มีประสิทธิภาพ เช่น จีพียู 64k Al-Dahle เขียนไว้ในข้อความภายในว่า "เราจะเปิดตัว GPU 64k! เราจำเป็นต้องเรียนรู้วิธีสร้างสิ่งที่ล้ำสมัยและชนะเกมนี้"
อย่างไรก็ตาม แม้ว่า Meta จะเผยแพร่โมเดล AI แบบโอเพ่นซอร์ส แต่ผู้บริหาร Meta ก็มุ่งเน้นไปที่การเอาชนะคู่แข่งเช่น OpenAI และ Anthropic ซึ่งโดยทั่วไปแล้วจะไม่เปิดเผยน้ำหนักของโมเดลของตน แทนที่จะวางโมเดลไว้ภายใต้ API ซึ่งก่อให้เกิดจุดเน้นที่สำคัญของการแข่งขัน
ดูถูกความกังวลเรื่องมิสทรัลและภายใน
Mistral สตาร์ทอัพด้านปัญญาประดิษฐ์ของฝรั่งเศสเป็นหนึ่งในคู่แข่งสาธารณะที่ใหญ่ที่สุดของ Meta แต่ผู้บริหารของ Meta กลับเพิกเฉยต่อเรื่องนี้อย่างชัดเจน ในข้อความหนึ่ง Al-Dahle กล่าวว่า "Mistral ไม่มีนัยสำคัญสำหรับเรา เราควรจะทำให้ดีขึ้นได้" สิ่งนี้ยังเผยให้เห็นถึงความวิตกกังวลอย่างมากภายใน Meta เกี่ยวกับการแข่งขัน AI และบทบาทของพวกเขาในอุตสาหกรรม
ในเวลาเดียวกัน ผู้นำ AI ของ Meta มักพูดคุยถึงวิธีที่พวกเขารับข้อมูลเพื่อฝึกอบรม Llama3 ในการสื่อสารภายใน และข้อมูลบางอย่างแสดงให้เห็นว่าผู้บริหารเต็มไปด้วยความคาดหวังสำหรับ Llama3 ผู้บริหารคนหนึ่งถึงกับกล่าวถึงในข้อความ: "Llama3 นั่นคือทั้งหมดที่ฉันจริงๆ ใส่ใจ”
ปัญหาลิขสิทธิ์และความท้าทายทางกฎหมาย
เมื่อ Meta พบกับการแข่งขันที่ดุเดือดในการพัฒนา Llama3 ข้อมูลการฝึกอบรมที่ใช้ก็เริ่มทำให้เกิดข้อพิพาททางกฎหมาย อัยการกล่าวหาว่าผู้บริหาร Meta อาจตัดมุมและใช้หนังสือที่มีลิขสิทธิ์เป็นข้อมูลการฝึกอบรมในขณะที่พวกเขาเร่งติดตามความคืบหน้าในการพัฒนา AI
ในข้อความ นักวิจัย Hugo Touvron เปิดเผยว่าการรวมกันของชุดข้อมูลที่ Meta ใช้ในการฝึกอบรม Llama2 นั้น "แย่มาก" และเสนอให้เพิ่มประสิทธิภาพ Llama3 โดยการปรับปรุงชุดข้อมูล พวกเขายังได้พูดคุยถึงการขจัดอุปสรรคในการใช้ชุดข้อมูล LibGen ซึ่งประกอบด้วยผลงานที่มีลิขสิทธิ์จากผู้จัดพิมพ์ เช่น Cengage Learning, Macmillan Learning, McGraw Hill และ Pearson Education
แม้จะมีปัญหาด้านลิขสิทธิ์ Mark Zuckerberg ซีอีโอของ Meta เน้นย้ำว่า Meta จะยังคงส่งเสริมความก้าวหน้าของโมเดล Llama ต่อไป และลดช่องว่างกับโมเดลปิดอื่น ๆ เช่น OpenAI และ Google
โอกาสในอนาคตของ Meta และตำแหน่งทางการตลาดของ Llama3
ในเดือนกรกฎาคม ปี 2024 Zuckerberg กล่าวว่า Llama3 มีประสิทธิภาพเทียบเท่ากับโมเดล AI ที่ทันสมัยที่สุด และเป็นผู้นำในบางด้าน เขาคาดการณ์ว่าตั้งแต่ปี 2025 ซีรีส์ Llama ของ Meta จะกลายเป็นโมเดล AI ที่ทันสมัยที่สุดในอุตสาหกรรม อย่างไรก็ตาม การเปิดตัว Llama3 ยังคงต้องต่อสู้กับการฟ้องร้องเรื่องลิขสิทธิ์ที่เพิ่มขึ้น โดยเฉพาะอย่างยิ่งการตรวจสอบทางกฎหมายเกี่ยวกับข้อมูลการฝึกอบรม
โดยรวมแล้ว Meta แสดงให้เห็นถึงความทะเยอทะยานและความสามารถในการแข่งขันในด้าน AI ในระหว่างการพัฒนา Llama3 แต่ยังเผยให้เห็นปัญหาในการรับข้อมูลและการปฏิบัติตามลิขสิทธิ์อีกด้วย ตำแหน่งทางการตลาดในอนาคตของ Llama3 และกลยุทธ์ AI ของ Meta จะขึ้นอยู่กับความสามารถในการแก้ไขปัญหาความท้าทายทางกฎหมายเหล่านี้อย่างมีประสิทธิภาพ