구글의 AI 프로젝트 제미니(Gemini)가 최근 새로운 내부 규정으로 인해 논란을 불러일으켰다. 보고서에 따르면 Gemini가 생성한 콘텐츠 평가를 담당하는 아웃소싱 담당자에게 전문 지식이 없는 영역, 특히 의료와 같은 민감한 영역을 평가하도록 요청하여 Gemini 정보의 정확성에 대한 우려가 제기되었습니다. 이러한 정책 조정은 아웃소싱 인력의 업무에 직접적인 영향을 미치며 Gemini의 평가 품질에도 간접적으로 영향을 미칩니다.
최근 구글의 AI 프로젝트 제미니(Gemini)는 새로운 내부 규정으로 인해 정보의 정확성에 대한 우려가 제기됐다. 보고서에 따르면 AI 생성 콘텐츠를 평가하는 업무를 맡은 아웃소싱 인력은 특히 의료와 같은 민감한 주제에 대해 전문 지식이 없는 영역을 평가하도록 요청받고 있습니다.
이들 아웃소싱 인력은 글로벌 기술 서비스 기업인 글로벌로직(GlobalLogic) 출신이다. 구글은 이들에게 주로 '진정성' 등의 요소를 고려하여 AI가 생성한 응답을 평가하도록 요구한다. 이전에는 아웃소싱 업체가 관련 전문 지식이 없는 질문을 건너뛸 수 있었습니다. 예를 들어 심장학에 관한 전문 질문을 평가하지 않을 수 있었습니다. 이는 채점의 정확성을 보장하고 관련 배경을 가진 사람만이 효과적인 평가를 수행할 수 있도록 하기 위해 수행됩니다.
그러나 지난 주 GlobalLogic은 아웃소싱 업체가 더 이상 해당 전문 분야에 대한 질문을 건너뛸 수 없으며 대신 이해하는 부분을 평가하고 해당 분야에 대한 지식 부족을 설명하도록 요구하는 Google의 최신 요구 사항을 발표했습니다. 이러한 변화는 이러한 관행이 일부 복잡한 주제에 대한 Gemini의 정확성에 영향을 미칠 수 있다는 아웃소싱 업체들 사이에 광범위한 우려를 불러일으켰습니다.
예를 들어, 일부 아웃소싱 업체는 내부 커뮤니케이션에서 이전 건너뛰기 옵션은 채점의 정확성을 높이기 위한 것이었지만 새로운 규칙의 시행으로 인해 희귀 질환과 같이 경험하지 못한 일부 문제를 평가해야 한다고 언급했습니다. 내부 이메일에 따르면 원래 규칙은 "이 작업에 필요한 전문 지식이 없으면 건너뛰십시오."라는 새로운 규칙은 "전문 지식이 필요한 메시지는 건너뛰어서는 안 됩니다."입니다. 불편한.
새로운 규정에 따라 아웃소싱 업체는 두 가지 상황에서만 평가 작업을 건너뛸 수 있습니다. 하나는 완전한 프롬프트나 응답과 같이 정보가 완전히 누락된 경우이고, 다른 하나는 콘텐츠가 유해할 수 있고 평가를 수행하기 위해 특별한 동의가 필요한 경우입니다. 이러한 새로운 규칙은 Gemini의 성능을 향상시키기 위한 것이지만 실제 운영에서 복잡한 주제에 대한 이해와 피드백에 영향을 미칠 수 있습니다.
구글은 이 사안에 대해 별다른 대응을 하지 않았으며, 아웃소싱 업체들의 우려도 점차 커지고 있다.
가장 밝은 부분:
아웃소싱 인력은 특히 의료와 같은 민감한 분야에서 전문 지식이 없는 AI 생성 응답을 평가하도록 요청받습니다.
새로운 규정에서는 "건너뛰기" 옵션을 제거하고 아웃소싱업체가 전문 지식이 부족하더라도 점수를 매기도록 요구합니다.
이 정책은 복잡한 주제에 대한 Gemini의 정확성에 영향을 미쳐 아웃소싱 직원들 사이에 불안감과 우려를 불러일으킬 수 있습니다.
Gemini의 새로운 규정에 대한 Google의 대응이 지연되고 아웃소싱 직원 간의 우려가 계속 커지면서 Gemini의 향후 개발은 새로운 도전에 직면하게 되었습니다. AI 기술의 신뢰성과 안전성을 보장하려면 AI 모델의 정확도 평가 방법을 더욱 개선해야 합니다.