เมื่อเร็ว ๆ นี้ การฝึกอบรมคลังข้อมูลภาษาจีน Gemini-Pro ของ Google ได้จุดประกายให้เกิดการถกเถียงกันอย่างดุเดือด โดยยอมรับว่าได้ใช้ข้อมูล Baidu Wenxin Yiyan ในการฝึกอบรม ซึ่งทำให้เกิดความโกลาหลบนโซเชียลมีเดีย ชาวเน็ตจำนวนมากตั้งคำถามว่ามีการแข่งขันที่ไม่เป็นธรรมระหว่างบริษัทขนาดใหญ่หรือไม่ ซึ่งทำให้เกิดการอภิปรายเกี่ยวกับแหล่งที่มาและจริยธรรมของข้อมูลการฝึกอบรมโมเดลปัญญาประดิษฐ์ ประเด็นสำคัญของเหตุการณ์นี้คือ Gemini-Pro อาศัยข้อมูลของ Baidu Wenxinyiyan ในการฝึกอบรมคลังข้อมูลของจีน ซึ่งท้าทายขอบเขตของอุตสาหกรรมในเรื่องความเป็นเจ้าของข้อมูลและสิทธิ์ในทรัพย์สินทางปัญญาโดยตรง และยังเผยให้เห็นถึงความเสี่ยงที่อาจเกิดขึ้นและอันตรายที่ซ่อนอยู่ในการฝึกอบรมโมเดลภาษาขนาดใหญ่ .
บทความนี้มุ่งเน้นไปที่:
คลังข้อมูลภาษาจีน Gemini-Pro ของ Google ก่อให้เกิดความขัดแย้ง โดยเปิดเผยว่าบริษัทใช้ Baidu Wenxinyiyan ในการฝึกอบรม Gemini-Pro จุดประกายความสนใจบนโซเชียลมีเดียหลังจากดูสับสนเกี่ยวกับตัวตนระหว่างการทดสอบ ในที่สุดเจ้าหน้าที่ของ Gemini ก็ยอมรับว่าใช้ Baidu Wenxin สำหรับข้อมูลการฝึกอบรมของจีน ซึ่งทำให้หัวข้อนี้เข้มข้นยิ่งขึ้น
เหตุการณ์นี้ไม่เพียงแต่เน้นย้ำถึงความขัดแย้งระหว่างการแบ่งปันทรัพยากรข้อมูลและการคุ้มครองทรัพย์สินทางปัญญาในด้านปัญญาประดิษฐ์ แต่ยังทำให้เกิดความกังวลเกี่ยวกับความน่าเชื่อถือและความโปร่งใสของแบบจำลองภาษาขนาดใหญ่ ในอนาคต การฝึกอบรมและการประยุกต์ใช้โมเดลปัญญาประดิษฐ์จะต้องมีการจัดการที่มีมาตรฐานมากขึ้นและมาตรฐานทางจริยธรรมที่เข้มงวดมากขึ้น เพื่อรับประกันการพัฒนาที่ดีของอุตสาหกรรม