최신 연구 : AI 모델은 사실적인 질문에 답할 때 성능이 좋지 않으며 GPT -4O 정확도는 38.2%에 불과합니다.
OpenAI의 최근 연구에 따르면 인공 지능 기술의 빠른 발전에도 불구하고 현재 가장 진보 된 언어 모델은 사실적인 질문에 대답하는 데 성공률이 훨씬 낮습니다. 이 연구는 과학, 정치 및 예술을 다루는 4,326으로 구성된 OpenAi의 자체 SimpleQA 벤치 마크 테스트를 사용했습니다.
2025-02-15