최근 AI 분야의 강자인 구글과 오픈AI(OpenAI)가 치열한 경쟁을 펼치고 있으며, 양사가 내놓는 신모델의 출시 속도는 엄청나다. 이러한 경쟁은 모델 성능 경쟁에만 반영되는 것이 아니라 AI 기술 반복의 급속한 발전과 시장에 대한 빠른 대응 능력도 반영됩니다. Google과 OpenAI의 기술 연구개발에 대한 투자와 혁신은 앞으로도 인공지능 분야의 발전을 촉진하고 사용자에게 더욱 편리하고 스마트한 서비스를 제공할 것입니다.
최근 구글과 오픈AI(OpenAI)의 경쟁이 다시 과열됐다. GPT-4o의 새 버전이 AI 경쟁 목록에서 1위를 차지한 지 하루 만에 Google은 최신 실험 모델 Gemini-Exp-1121을 출시하여 빠르게 우승을 탈환했습니다. 불과 일주일 전 구글은 Gemini-Exp-1114를 출시했는데, 이는 구글이 OpenAI의 역학에 매우 빠르게 반응했음을 나타내는 것으로 보입니다.
구글 딥마인드(Google DeepMind)의 수석 과학자인 잭 레이(Jack Rae)는 이것이 "블리츠"라고 말했는데, 이는 사후 훈련의 반복 속도가 사전 훈련보다 빠르다는 것을 의미합니다.
공식 정보에 따르면 Gemini-Exp-1121은 주로 코딩 기능, 추론 기능 및 시각적 이해 기능 향상에 반영되어 여러 측면에서 크게 개선되었습니다. 또한 이 모델은 복잡한 프롬프트 단어의 스타일 제어에 있어서 현재의 상위 o1-preview 및 New Sonnet3.5와 비교할 수 있는 수준에 도달했습니다.
실제 테스트에서 Gemini-Exp-1121은 만화 이해를 처리하는 데 있어서 GPT-4o의 새 버전보다 더 나은 성능을 발휘했으며 답변은 더 포괄적이었고 정보를 제공하기 위해 자막과 대담한 강조를 명확하게 사용할 수 있었습니다. 고전 동물의 숲 논리 추론 문제에서는 Gemini-Exp-1121의 답변이 완전히 맞아 더욱 강력한 논리 추론 능력을 보여줬지만, 새 버전의 GPT-4o에서는 몇 가지 실수가 있었습니다.
동시에 OpenAI는 새로운 기능도 적극적으로 개발하고 있습니다. 최근 ChatGPT 최신 버전에서 '라이브 카메라' 영상 기능에 대한 코드가 발견되어 음성 및 시각 인식 분야의 발전을 보여줍니다. OpenAI 사용자는 고급 음성 모드를 사용할 때 처음으로 이 기능을 경험하게 되며 향후 이 기능의 사용을 확대하려는 의도를 보여줍니다.
내년에는 '라이브 카메라' 기능 출시로 인해 챗봇과의 주요 커뮤니케이션 방식이 점차 전통적인 텍스트 대화에서 음성 및 보다 지능적인 에이전트 서비스로 전환될 것으로 예상됩니다.
가장 밝은 부분:
구글의 신모델인 Gemini-Exp-1121은 정상에 오른 뒤 단숨에 GPT-4o를 제치고 AI 대회 정상에 복귀했다.
Gemini-Exp-1121은 코딩, 추론 및 시각적 이해 기능을 향상했으며 좋은 성능을 보였습니다.
OpenAI가 향후 AI와의 소통 방식을 바꿀 수 있는 '실시간 카메라' 기능을 개발하고 있다.
전체적으로 Google과 OpenAI의 경쟁은 AI 기술의 급속한 발전을 촉진했습니다. 앞으로 AI가 인간과 상호 작용하는 방식은 더욱 다양해지고 지능화될 것이므로 기대해 볼 만합니다.