บทความนี้วิเคราะห์ข้อมูลที่รั่วไหลออกมาจากเอกสารภายในของ Meta ซึ่งเผยให้เห็นถึงความรุนแรงของการแข่งขันภายในของ Meta และความปรารถนาอันแรงกล้าที่จะก้าวข้าม OpenAI GPT-4 ในระหว่างการพัฒนาโมเดลขนาดใหญ่ Llama3 ข้อมูลนี้มาจากคดีความเกี่ยวกับลิขสิทธิ์ปัญญาประดิษฐ์ เอกสารที่ศาลเปิดผนึกแสดงการอภิปรายภายในและกระบวนการตัดสินใจของผู้บริหาร Meta ในแง่ของการได้มาซึ่งข้อมูล การปรับปรุงประสิทธิภาพของแบบจำลอง และการเปรียบเทียบกับคู่แข่ง โดยเน้นย้ำถึงการแสวงหาแรงกดดันและ ความท้าทายในการเป็นผู้นำทางเทคโนโลยี
เมื่อเร็ว ๆ นี้ อีเมลภายในของบริษัท Meta เกี่ยวกับการพัฒนา Llama3 ได้รับการเปิดเผยต่อสาธารณะ ซึ่งเปิดเผยถึงความพยายามและความยากลำบากที่ผู้บริหารบริษัทต้องเผชิญเพื่อที่จะก้าวข้ามโมเดล GPT-4 ของ OpenAI ในอีเมล ผู้บริหาร Meta แสดงความปรารถนาอย่างแรงกล้าที่จะเอาชนะคู่แข่งและแสวงหาวิธีปรับปรุงประสิทธิภาพของโมเดลอย่างจริงจัง แม้จะเสี่ยงต่อการใช้ข้อมูลที่มีลิขสิทธิ์ก็ตาม อย่างไรก็ตาม การเร่งรีบครั้งนี้ยังนำไปสู่การฟ้องร้องเรื่องลิขสิทธิ์อีกด้วย แม้ว่าในที่สุด Llama3 จะเปิดตัวและบรรลุผลสำเร็จที่ดี แต่ก็ยังมีความกดดันและความเสี่ยงมหาศาลที่ซ่อนอยู่เบื้องหลัง ด้วยการเปิดเผยเอกสารภายในเหล่านี้ เราจะได้รับความเข้าใจที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับความเข้มข้นของการแข่งขันระหว่างบริษัทเทคโนโลยีขนาดใหญ่ในด้านปัญญาประดิษฐ์ ตลอดจนกลยุทธ์ที่พวกเขานำมาใช้และความท้าทายที่พวกเขาเผชิญในการแสวงหาความเป็นผู้นำทางเทคโนโลยี
แม้ว่า Meta จะเผยแพร่โมเดล AI แบบเปิด แต่ความเป็นผู้นำด้าน AI ของบริษัทกลับมุ่งเน้นไปที่คู่แข่งที่ไม่เปิดเผยน้ำหนักของโมเดล เช่น Anthropic และ OpenAI และถือว่า Claude และ GPT-4 เป็นมาตรฐานการทำงาน แม้ว่า Mistral สตาร์ทอัพด้าน AI ของฝรั่งเศสจะได้รับการกล่าวถึงหลายครั้ง แต่ผู้บริหาร Meta ดูเหมือนจะเพิกเฉยต่อการประเมินนี้ “มิสทรัลเป็นเหมือนเค้กชิ้นหนึ่งสำหรับเรา และเราควรจะทำได้ดีกว่านี้” อัล-ดาห์ กล่าวในข้อความ
ในด้าน AI บริษัทยักษ์ใหญ่ต่างแข่งขันกันที่จะเปิดตัวโมเดล AI ขั้นสูง และเอกสารของศาลเหล่านี้แสดงให้เห็นว่า Meta มีความตึงเครียดสูงในการแข่งขันครั้งนี้ ในข้อความหลายข้อความ ผู้นำ AI ของ Meta กล่าวว่าพวกเขา "กระตือรือร้นมาก" ในการรับข้อมูลที่จำเป็นในการฝึกอบรม Llama ผู้บริหารคนหนึ่งถึงกับพูดว่า: "Llama3 เป็นสิ่งเดียวที่ฉันสนใจ" พวกเขาพูดคุยกันถึงวิธีปรับปรุงชุดข้อมูลเพื่อปรับปรุงประสิทธิภาพของ Llama3
อย่างไรก็ตาม อัยการในคดีกล่าวหาว่าผู้บริหาร Meta อาจละเว้นการใช้ข้อมูลในการเร่งเปิดตัวโมเดล AI ซึ่งเกี่ยวข้องกับหนังสือที่มีลิขสิทธิ์บางเล่ม Touvron กล่าวว่าการรวมชุดข้อมูลของ Llama2 “ใช้งานไม่ได้ดี” และหารือกันว่า Llama3 สามารถปรับปรุงด้วยแหล่งข้อมูลที่ดีกว่าได้อย่างไร Al-Dah ถามว่า: "เรามีชุดข้อมูลที่ถูกต้องหรือไม่? มีอะไรที่เราไม่สามารถใช้ด้วยเหตุผลโง่ ๆ ได้หรือไม่?"
Mark Zuckerberg ซีอีโอของ Meta เคยแสดงความพยายามในการลดช่องว่างด้านประสิทธิภาพระหว่างโมเดล Llama และโมเดลโอเพ่นซอร์สจาก OpenAI, Google และบริษัทอื่นๆ แหล่งข้อมูลภายในเหล่านี้เปิดเผยว่า Meta อยู่ภายใต้แรงกดดันอย่างมากในการบรรลุเป้าหมายนี้ Zuckerberg กล่าวในจดหมายฉบับเดือนกรกฎาคม 2024 ว่า "ในปีนี้ Llama3 สามารถแข่งขันกับโมเดลที่ทันสมัยที่สุดและเป็นผู้นำในบางพื้นที่"
ในเดือนเมษายน ปี 2024 ในที่สุด Meta ก็ได้เปิดตัว Llama3 โมเดล AI แบบเปิดนี้ทำงานได้ดีในการแข่งขัน ซึ่งเหนือกว่าตัวเลือกแบบเปิดจาก Mistral แต่ข้อมูลที่ใช้ในการฝึกโมเดลนั้น - ข้อมูลดังกล่าวถูกกล่าวหาว่าได้รับโดย Zuckerberg การอนุมัติกำลังเผชิญกับการตรวจสอบข้อเท็จจริงจากหลาย ๆ คน คดีความ
ไฮไลท์:
ผู้บริหาร Meta มุ่งเน้นไปที่การเหนือกว่าโมเดล GPT-4 ของ OpenAI ในระหว่างการพัฒนา Llama3
บริษัทมีความก้าวร้าวในการรับข้อมูล แต่ต้องเผชิญกับข้อกล่าวหาเรื่องการใช้ข้อมูลที่ถูกจำกัดลิขสิทธิ์
Zuckerberg คาดว่าโมเดลลามะในอนาคตจะเป็นตัวเลือกที่ล้ำหน้าที่สุดในอุตสาหกรรม
โดยรวมแล้ว กระบวนการพัฒนา Llama3 ของ Meta สะท้อนให้เห็นถึงการแข่งขันที่รุนแรงในด้านปัญญาประดิษฐ์ และยังเผยให้เห็นความเสี่ยงทางกฎหมายและจริยธรรมที่อาจต้องเผชิญในการแสวงหาความเร็วและความเป็นผู้นำ ในอนาคต การสร้างสมดุลระหว่างการพัฒนาเทคโนโลยีและการปฏิบัติตามกฎระเบียบจะกลายเป็นประเด็นสำคัญในอุตสาหกรรมปัญญาประดิษฐ์