OpenAI는 12일간의 기술 공유 라이브 방송 이벤트를 마친 후 차세대 추론 모델 o3과 특정 작업에 최적화된 간소화된 버전의 o3-mini를 출시했습니다. o3는 여러 벤치마크 테스트에서 획기적인 발전을 이루었으며, 그 성능은 이전 세대 모델 o1을 크게 능가하고, 일부 측면에서는 일반 인공지능(AGI) 수준에도 접근합니다. 이 릴리스는 업계에서 광범위한 관심을 끌었으며 향후 프로그래밍 방법과 프로그래머의 작업 모델에 지대한 영향을 미칠 것으로 여겨집니다.
오픈AI는 12일간의 기술 공유 라이브 방송을 마친 뒤 앞서 출시한 o1 추론 모델을 업그레이드한 차세대 추론 모델 o3를 마지막 날 공개했다. o3 모델 시리즈에는 o3와 o3-mini의 두 가지 버전이 포함되어 있으며, 그중 o3-mini는 특정 작업에 맞게 미세 조정된 더 작고 효율적인 모델입니다. OpenAI는 o3 모델이 특정 조건 하에서 일반 인공지능(AGI), 즉 인간이 완료할 수 있는 모든 작업을 완료할 수 있는 인공지능을 달성하는 데 가까워질 수 있다고 밝혔습니다.
ARC-AGI 그래픽 논리 추론 벤치마크에서 o3 모델은 낮은 컴퓨팅 시나리오에서 75.7%를 기록하며 기록적인 점수를 달성했으며, 높은 컴퓨팅 테스트에서는 87.5%에 도달하여 인간 수준에 도달한 벤치마크를 넘어섰습니다. 임계값 85%. 이에 비해 o1 모델의 점수는 25%에서 32% 사이에 불과하며 o3은 o1보다 거의 3배 더 나은 성능을 발휘합니다. 세계적으로 유명한 코딩 경쟁 플랫폼 Codeforces에서 o3는 2727점을 획득한 반면, o1은 1891점에 그쳤습니다.
Cheetah Mobile 또는 Orion Star의 Fu Sheng 회장은 OpenAI o3의 출시는 모든 사람이 프로그래머가 되는 시대의 도래를 예고한다고 말했습니다. 사용자는 프로그램을 작성하기 위해 Python이나 C 언어에 능숙할 필요가 없습니다. 요구 사항을 제시하면 대규모 예측 모델이 프로그래밍 작업을 완료하는 데 도움이 될 수 있습니다. Fu Sheng은 o3의 출시로 대규모 언어 모델의 프로그래밍 능력이 프로그래머의 99.9%를 능가한다고 믿습니다. Codeforces 세계 수준의 프로그래밍 대회에서 o3는 175위라는 최고 결과를 달성한 반면 o1은 90% 이상만 이겼습니다. 프로그래머, GPT-4o는 이전에 프로그래머의 11%만을 이겼습니다.
오픈AI는 내년 1월 말 o3 모델을 공식 출시할 예정이다. Fu Sheng은 프로그래머가 완전히 사라지지는 않겠지만 그들의 작업은 사용자 요구를 이해하고 대규모 논리를 구축하는 데 더 많이 옮겨갈 것이며 요구를 코드로 변환하는 작업은 대부분 AI에 의해 완료될 것이라고 지적했습니다. 이번 릴리스는 프로그래밍 분야에서 AI의 광범위한 적용을 예고하고 프로그래머의 작업 방식을 바꿀 수도 있습니다.
o3 모델의 출시는 인공지능 기술의 획기적인 발전을 의미하며, O3의 강력한 추론 및 프로그래밍 기능은 다양한 분야에 지대한 영향을 미칠 것입니다. 앞으로는 기술의 지속적인 발전과 발전으로 인공지능이 더 많은 분야에서 더 큰 역할을 하고 인류 사회에 더 큰 편리함을 가져다 줄 것으로 기대됩니다.