最近、人工知能分野の大手企業がデータ取得や技術協力について計画を立て、頻繁に動き出している。この記事では、いくつかの重要なニュースに焦点を当て、それが人工知能業界の発展と将来の傾向に与える影響を分析します。このニュースには、Reddit と Google との巨額契約、および OpenAI と複数の出版組織との綿密な協力が含まれており、大規模モデルのトレーニング用の高品質データに対する膨大な需要と、その中で出版業界が果たす重要な役割を示しています。これらのコラボレーションは、人工知能の開発に新たな刺激を与えるだけでなく、データリソースの取得と利用が将来的により標準化され、商業化されることを示しています。
事情に詳しい関係者によると、レディットとグーグルは年間約6000万ドル相当の契約を結んでいる。 Springer Publishing Group は OpenAI と提携し、ジャーナリズムと人工知能テクノロジーを深く統合する初の出版組織となりました。 OpenAI と Axel Springer のコラボレーションは、大規模なモデルのトレーニングにはデータへの有料アクセスが必要な可能性があることを示しています。出版業界の企業は豊富な電子グラフィックスとテキスト リソースを持っており、これらは重要な大規模なモデル トレーニング データ セットになる可能性があります。 CITIC Publishingは著者や大手モデル企業と語学研修などで協力しようとしており、Palm Reading TechnologyはByteと著作権やコンテンツ制作などの面で緊密な協力を行っている。上記の事例からわかるように、人工知能産業は急速な発展段階にあり、データリソースをめぐる競争はますます激化しており、将来的にはデータの取得と活用の方法が大きく変化するでしょう。また、出版業界に新たな機会と課題をもたらします。