OpenAI, 글로벌 언어 평등을 촉진하기 위해 다국어 AI 데이터 세트 출시

저자：Eve Cole 업데이트 시간：2024-12-01 20:50:01

Downcodes의 편집자는 OpenAI가 최근 아랍어, 독일어, 스와힐리어 및 기타 언어를 포함하는 14개 언어로 AI 성능을 평가하는 것을 목표로 하는 블록버스터 다국어 데이터 세트 MMMLU를 출시했으며, 이 데이터가 Hugging Face에 공개적으로 사용되었다는 사실을 알게 되었습니다. 플랫폼. 이러한 움직임은 OpenAI가 글로벌 AI 분야에서 이룬 또 다른 중요한 진전을 의미하며, 저자원 언어에 초점을 맞춘 AI 연구의 격차를 메우고 기업과 정부가 글로벌 사용자와 더 잘 상호 작용할 수 있는 새로운 방법을 제공합니다. MMMLU 데이터 세트의 출시는 의심할 여지없이 다국어 AI 기술의 개발 및 적용을 촉진할 것입니다.

최근 OpenAI는 아랍어, 독일어, 스와힐리어, 벵골어, 요루바어를 포함한 14개 언어로 인공 지능의 성능을 평가하도록 설계된 블록버스터 다국어 데이터 세트를 출시했습니다.

MMMLU(Multi-Language Large-Scale Multi-Task Language Understanding)라고 불리는 이 데이터 세트는 개방형 데이터 플랫폼 Hugging Face에 공개되어 글로벌 AI 분야에서 OpenAI의 또 다른 중요한 진전을 이뤘습니다.

데이터세트 입구: https://huggingface.co/datasets/openai/MMMLU

이전 MMLU(대규모 다중 작업 언어 이해) 데이터 세트는 영어로만 평가되었으며 수학, 법률, 컴퓨터 과학 등 57개 주제를 다루었습니다. 새로 출시된 MMMLU 데이터 세트는 다국어에 초점을 맞춰 AI 연구에서 자원이 부족한 언어의 격차를 메우는 것을 목표로 하고 있습니다. 이번에 OpenAI의 움직임은 AI 시스템이 전 세계 사용자와 더 잘 상호 작용할 수 있도록 기업과 정부의 증가하는 요구를 충족하는 것입니다.

데이터 세트의 높은 정확성을 보장하기 위해 OpenAI는 전문 인간 번역가를 활용하여 MMMLU 데이터 세트를 생성합니다. 이는 많은 자동 번역 도구가 리소스가 부족한 언어를 처리할 때 미묘한 오류가 발생하기 쉽기 때문에 특히 중요하며, 이는 의료, 법률, 금융과 같이 정밀도가 중요한 산업에서 심각한 결과를 초래할 수 있습니다. 따라서 OpenAI는 인간 번역을 사용하여 데이터 세트가 다국어 AI 모델 평가를 위한 신뢰할 수 있는 기반을 제공할 수 있도록 합니다.

동시에 OpenAI는 특히 중저소득 국가의 개발자와 사명감을 지닌 조직이 AI 기술을 사용하여 지역 문제를 해결할 수 있도록 지원하는 프로젝트인 "OpenAI Academy"의 출시도 발표했습니다. OpenAI는 현지 AI 인재가 최신 리소스에 액세스할 수 있도록 교육, 기술 지침 및 API 사용 크레딧으로 100만 달러를 제공할 것입니다.

기업의 경우 MMMLU 데이터 세트는 글로벌 시장에서 AI 시스템을 평가할 수 있는 좋은 기회를 제공합니다. 고객 서비스, 콘텐츠 조정, 데이터 분석 등 다양한 언어로 원활하게 작동할 수 있는 AI 시스템은 기업이 의사소통 장벽을 줄이고 사용자 경험을 개선하는 데 도움이 될 것입니다.

더 많은 기업과 연구자들이 이 다국어 벤치마크를 테스트에 사용하기 시작하면서 AI 시스템의 다국어 기능은 앞으로 점점 더 중요해질 것입니다. OpenAI의 데이터 세트 출시는 다국어 AI 분야에서 OpenAI를 자리매김할 뿐만 아니라 미래 기술 개발을 적극적으로 추진합니다.

가장 밝은 부분:

? OpenAI는 다국어 AI 연구 및 적용을 촉진하기 위해 14개 언어를 포함하는 MMMLU 데이터 세트를 출시했습니다.

??‍?데이터 세트는 높은 정확성을 보장하기 위해 전문 번역가에 의해 생성되며 특히 수요가 많은 산업에 적합합니다.

OpenAI Academy는 저소득 국가의 AI 개발자의 성장과 발전을 지원하기 위해 시작되었습니다.

전체적으로 OpenAI와 이를 지원하는 OpenAI Academy 프로젝트가 발표한 MMMLU 데이터 세트는 글로벌 AI 개발을 촉진하고 AI 기술의 포용성을 촉진하려는 결단력과 행동을 보여줍니다. 이는 다국어 AI 연구 및 적용에 긍정적인 영향을 미칠 것이며 업계의 주목을 받을 만합니다.