GoogleのAIプロジェクト「Gemini」は最近、新たな内部規定により物議を醸した。報道によると、ジェミニが生成したコンテンツの評価を担当する外部委託担当者は、専門知識を持たない分野、特にヘルスケアなどのデリケートな分野の評価を依頼されており、ジェミニの情報の正確性について懸念が生じている。この方針の調整は、外部委託された担当者の仕事に直接影響を与え、間接的にジェミニの評価の質に影響を与えます。
最近、Google の AI プロジェクト Gemini は、新しい内部規定により情報の正確性について懸念を引き起こしました。報告書によると、AI が生成したコンテンツの評価を担当する外部委託担当者は、専門知識のない分野、特にヘルスケアなどのデリケートなトピックについて評価するよう求められています。
これらの外部委託担当者は、世界的なテクノロジー サービス企業である GlobalLogic の社員です。Google は、主に「信頼性」などの要素を考慮して、AI によって生成された応答を評価することを要求しています。以前は、外部委託者は、たとえば、心臓病に関する専門的な質問を評価しないなど、関連する専門知識を持たない質問をスキップすることを選択できました。これは、スコアリングの正確性を確保し、関連する背景を持つ人のみが効果的な評価を実行できるようにするために行われます。
しかし、先週GlobalLogicはGoogleの最新の要件を発表し、アウトソーシング業者はそのような専門分野の質問を飛ばすことはもはや許されないが、代わりに理解している部分を評価し、関連分野での知識不足を説明することが求められるとしている。この変更は、この慣行がいくつかの複雑なトピックに関する Gemini の精度に影響を与える可能性があるという、アウトソーシング業者の間で広く懸念を引き起こしました。
たとえば、一部のアウトソーシング会社は内部コミュニケーションで、以前のスキップ オプションはスコアリングの精度を向上させるためだったが、新しいルールの導入により、希少疾患などの経験のないいくつかの問題を評価する必要があると述べました。社内メールによると、元のルールは「このタスクに必要な専門知識がない場合はスキップしてください」だったが、新しいルールは「専門知識が必要なプロンプトはスキップしてはならない」となっている。不快。
新しい規制では、アウトソーシング業者が評価タスクをスキップできるのは 2 つの状況の場合のみです。1 つは、完全なプロンプトや応答など、情報が完全に欠落している場合で、もう 1 つは、内容が有害である可能性があり、評価の実施に特別な同意が必要な場合です。これらの新しいルールは Gemini のパフォーマンスを向上させることを目的としていますが、実際の運用における複雑なトピックの理解とフィードバックに影響を与える可能性があります。
この件についてグーグルは応じておらず、委託先の懸念も徐々に高まっている。
ハイライト:
外部委託された担当者は、特に医療などの機密分野において、専門知識を持たない AI によって生成された応答を評価するよう求められます。
新しい規制では「スキップ」オプションが廃止され、アウトソーシング業者に専門知識がない場合でもスコアを付けることが求められる。
このポリシーは、複雑なトピックに関する Gemini の精度に影響を及ぼし、外部委託された担当者に不安と懸念を引き起こす可能性があります。
Geminiの新たな規制に対するGoogleの対応は遅れており、アウトソーシング担当者の懸念は高まり続けており、Geminiの今後の発展は新たな課題に直面している。 AI技術の信頼性と安全性を確保するためには、AIモデルの精度評価手法のさらなる改善が必要です。