最近、Google の Gemini-Pro 中国語コーパス トレーニングが激しい議論を巻き起こし、Baidu Wenxin Yiyan データをトレーニングに使用したことを認め、ソーシャル メディアで大騒ぎを引き起こしました。多くのネチズンは大企業間で不公平な競争があったのではないかと疑問を抱き、人工知能モデルのトレーニングデータの出所や倫理をめぐる議論が巻き起こった。 事件の核心は、Gemini-Pro が中国語コーパス トレーニングで Baidu Wenxinyiyan のデータに依存していたということであり、これはデータ所有権と知的財産権に関する業界の境界に直接的に挑戦するものであり、また、大規模な言語モデル トレーニングにおける潜在的なリスクと隠れた危険性を暴露しました。 。
この記事では次の点に焦点を当てています。
Google の Gemini-Pro 中国語コーパスがトレーニングに Baidu Wenxinyiyan を使用したことが明らかになり、ネット民は大企業がお互いのウールを盗もうとしているのではないかと疑問に思いました。 Gemini-Pro は、テスト中にその正体について混乱しているように見えた後、ソーシャル メディアの注目を集めました。ジェミニ当局者はついにBaidu Wenxinを中国のトレーニングデータに使用したことを認め、話題はさらに激化した。
この事件は、人工知能分野におけるデータリソースの共有と知的財産保護の間の矛盾を浮き彫りにするだけでなく、大規模な言語モデルの信頼性と透明性についての懸念も引き起こしています。将来的には、業界の健全な発展を確保するために、人工知能モデルのトレーニングと適用には、より標準化された管理とより厳格な倫理基準が必要になります。