في الآونة الأخيرة، أثار تدريب مجموعة Gemini-Pro الصينية من Google مناقشات ساخنة، واعترفت بأنها استخدمت بيانات Baidu Wenxin Yiyan للتدريب، مما أثار ضجة على وسائل التواصل الاجتماعي. وتساءل العديد من مستخدمي الإنترنت عما إذا كانت هناك منافسة غير عادلة بين الشركات الكبيرة، مما أثار مناقشات حول مصادر وأخلاقيات بيانات التدريب على نماذج الذكاء الاصطناعي. جوهر الحادث هو أن Gemini-Pro اعتمدت على بيانات Baidu Wenxinyiyan في تدريب المجموعة الصينية، مما يمثل تحديًا مباشرًا لحدود الصناعة فيما يتعلق بملكية البيانات وحقوق الملكية الفكرية، كما كشف أيضًا عن المخاطر المحتملة والمخاطر الخفية في التدريب على نماذج اللغة على نطاق واسع. .
تركز المقالة على:
أثارت مجموعة Google Gemini-Pro الصينية جدلاً، حيث كشفت أنها استخدمت Baidu Wenxinyiyan للتدريب، وتساءل مستخدمو الإنترنت عما إذا كانت الشركات الكبرى تحاول سرقة صوف بعضها البعض. أثارت لعبة Gemini-Pro اهتمام وسائل التواصل الاجتماعي بعد أن بدت مرتبكة بشأن هويتها أثناء الاختبار. اعترف مسؤولو جيميني أخيرًا باستخدام Baidu Wenxin لبيانات التدريب الصينية، مما زاد من تكثيف الموضوع.
لا تسلط هذه الحادثة الضوء على التناقض بين مشاركة موارد البيانات وحماية الملكية الفكرية في مجال الذكاء الاصطناعي فحسب، بل تثير أيضًا مخاوف بشأن مصداقية وشفافية النماذج اللغوية الكبيرة. في المستقبل، سيتطلب تدريب وتطبيق نماذج الذكاء الاصطناعي إدارة أكثر توحيدًا ومعايير أخلاقية أكثر صرامة لضمان التنمية الصحية للصناعة.