최근 대규모 언어 모델의 개발과 반복 속도를 두고 AI 거대 기업 구글과 오픈AI(OpenAI)의 경쟁이 치열해지고 있다. 구글이 새롭게 출시한 Gemini-Exp-1121 모델은 여러 주요 지표에서 OpenAI의 GPT-4o를 능가하며 다시 한 번 AI 경쟁 1위를 차지했습니다. Downcodes의 편집자는 AI 분야의 이러한 "블리츠"에 대한 심층적인 이해뿐만 아니라 양 당사자 간의 기술 및 기능의 최신 발전을 제공할 것입니다.
최근 구글과 오픈AI(OpenAI)의 경쟁이 다시 과열됐다. GPT-4o의 새 버전이 AI 경쟁 목록에서 1위를 차지한 지 하루 만에 Google은 최신 실험 모델 Gemini-Exp-1121을 출시하여 빠르게 우승을 탈환했습니다. 불과 일주일 전 구글은 Gemini-Exp-1114를 출시했는데, 이는 구글이 OpenAI의 역학에 매우 빠르게 대응했음을 나타내는 것으로 보입니다.
구글 딥마인드(Google DeepMind)의 수석 과학자인 잭 레이(Jack Rae)는 이것이 "블리츠"라고 말했는데, 이는 사후 훈련의 반복 속도가 사전 훈련보다 빠르다는 것을 의미합니다.
공식 정보에 따르면 Gemini-Exp-1121은 주로 코딩 기능, 추론 기능 및 시각적 이해 기능 향상에 반영되어 여러 측면에서 크게 개선되었습니다. 또한 이 모델은 복잡한 프롬프트 단어의 스타일 제어에 있어서 현재의 상위 o1-preview 및 New Sonnet3.5와 비교할 수 있는 수준에 도달했습니다.
실제 테스트에서 Gemini-Exp-1121은 만화 이해를 처리하는 데 있어서 GPT-4o의 새 버전보다 더 나은 성능을 발휘했으며 답변은 더 포괄적이었고 정보를 제공하기 위해 자막과 대담한 강조를 명확하게 사용할 수 있었습니다. 고전 동물의 숲 논리 추론 문제에서는 Gemini-Exp-1121의 답변이 완전히 맞아 더욱 강력한 논리 추론 능력을 보여줬지만, 새 버전의 GPT-4o에서는 몇 가지 실수가 있었습니다.
동시에 OpenAI는 새로운 기능도 적극적으로 개발하고 있습니다. 최근 ChatGPT 최신 버전에서 '라이브 카메라' 영상 기능에 대한 코드가 발견되어 음성 및 시각 인식 분야의 발전을 보여줍니다. OpenAI 사용자는 고급 음성 모드를 사용할 때 처음으로 이 기능을 경험하게 되며 향후 이 기능의 사용을 확대하려는 의도를 보여줍니다.
내년에는 '라이브 카메라' 기능 출시로 인해 챗봇과의 주요 커뮤니케이션 방식이 점차 전통적인 텍스트 대화에서 음성 및 보다 지능적인 에이전트 서비스로 전환될 것으로 예상됩니다.
이러한 AI 경쟁은 여전히 진행 중이며 Google과 OpenAI가 서로를 쫓고 있습니다. 이는 AI 기술이 앞으로도 지속적으로 혁신과 혁신을 이루어 사용자에게 더욱 편리하고 스마트한 서비스를 제공할 것임을 나타냅니다. 마지막에는 누가 승리할지 지켜보시죠!