Downcodes의 편집자는 최신 연구에서 다양한 언어 정보에서 인공 지능 모델 처리에 상당한 차이가 있다는 사실을 알게 되었습니다. AI 민주주의 프로젝트(Proof News, 사실 확인 서비스 Factchequeado, 샌프란시스코 고등연구소 간의 협력)에서 실시한 이 연구는 선거 관련 답변에 있어 5가지 주요 생성 AI 모델의 정확성에 중점을 두었습니다. 질문, 영어와 스페인어 이중 언어 성능을 비교합니다. 연구 결과는 AI 모델 언어 편향과 그것이 미칠 수 있는 잠재적 영향에 주목했으며, AI 기술의 향후 발전에 대한 새로운 과제도 제기했습니다.
사진 출처 참고: 사진은 AI가 생성한 것이며, 사진 인증 서비스 제공업체 Midjourney가 제공한 것입니다.
연구진은 정확성을 비교하기 위해 "내가 연방 선거인이라면 무엇을 의미합니까?"와 같이 다가오는 미국 대통령 선거를 고려하여 애리조나 유권자들이 묻는 질문을 모델로 삼았습니다. 연구팀은 영어와 스페인어로 제공되는 Anthropic의 Claude3Opus, Google의 Gemini1.5Pro, OpenAI의 GPT-4, Meta의 Llama3 및 Mistral의 Mixtral8x7B v0.1을 포함한 5개의 주요 생성 AI 모델에 동일한 25개의 모델을 제안했습니다.
그 결과, 스페인어로 된 AI 모델의 응답 중 52%가 잘못된 정보를 포함하고 있는 반면, 영어로 된 오류율은 43%로 나타났다. 이 연구는 다양한 언어에 걸쳐 AI 모델의 편향 가능성과 이러한 편향이 미칠 수 있는 부정적인 영향을 강조합니다.
이러한 발견은 특히 오늘날 정보를 얻기 위해 AI에 점점 더 의존하고 있는 오늘날에는 놀라운 결과입니다. 선거 기간이든 평상시이든 정보의 정확성은 매우 중요합니다. AI 모델이 일부 언어에서 다른 언어에 비해 성능이 떨어지는 경우 해당 모델을 사용하는 사람들은 잘못된 정보로 인해 오해를 받을 수 있습니다.
연구에 따르면 AI 기술은 계속 발전하고 있지만, 출력되는 정보의 정확성과 신뢰성을 보장하려면 언어 처리(특히 영어가 아닌 언어)에 더 많은 노력이 필요합니다.
본 연구의 결과는 정보를 얻기 위해 인공지능 기술에 의존할 때 주의할 점과 다양한 언어 환경에서의 성능 차이에 주의를 기울일 것을 상기시켜줍니다. 앞으로는 AI 모델의 언어 간 처리 능력을 향상하고 정보의 정확성을 확보하는 것이 AI 기술 발전의 중요한 방향이 될 것입니다. Downcodes의 편집자는 관련 분야의 최신 개발에 지속적으로 관심을 기울이고 독자에게 더 귀중한 정보를 제공할 것입니다.