Google Deepmind의 Gemini Experimental 버전 (Exp1114)은 일주일 이상의 커뮤니티 테스트에서 놀라운 성과를 달성했으며, 6,000 표 이상의 이점을 가진 많은 경쟁자를 능가했습니다. 보여주다. 테스트 결과에 따르면 Gemini-EXP-1114는 전체 점수에서 GPT-4 라이트로 1 위를 차지했으며 수학, 복잡한 프롬프트 처리 및 창의적인 작문과 같은 많은 주요 영역에서 강력한 멀티를 보여줍니다. 능력. 이는 AI 모형 분야에서 Google의 경쟁력이 크게 증가했습니다.
Google DeepMind의 최신 실험 버전의 Gemini (Exp1114)는 Chatbot Arena 플랫폼에서 놀라운 결과를 얻었습니다. 일주일 이상의 커뮤니티 테스트 후, 6,000 표 이상의 투표 데이터는이 새로운 모델이 경쟁 업체를 상당한 이점으로 능가하고 여러 주요 영역에서 놀라운 강점을 보여줍니다.
전체 등급 측면에서 Gemini-EXP-1114는 40 점 이상의 우수한 점수를 가진 GPT-4-Latest로 1 위를 차지했으며, 이전에 이끄는 GPT-4- 프리뷰 버전을 능가했습니다. 더 놀라운 것은 모델이 수학, 복잡한 프롬프트 및 창의적 글쓰기와 같은 핵심 필드에서 최고에 도달하여 매우 강력한 포괄적 인 강점을 보여 주었다는 것입니다.
특히 Gemini-EXP-11114의 진보는 인상적입니다.
총 순위에서 3 위에서 1 위까지
수학적 능력 평가는 3 위에서 1 일로 상승했습니다
복잡한 프롬프트 처리는 4 위에서 1 위로 올라갔습니다
창의적인 작문 공연은 2 위로 1 위로 향상되었습니다.
시각적 처리 기능도 먼저 순위를 매 깁니다
프로그래밍 수준은 5 위에서 3 위로 향상되었습니다.
Google AI Studio는 공식적 으로이 새로운 버전을 출시하여 사용자가 실제로이를 경험할 수 있도록했습니다. 그러나 커뮤니티는 또한 1,000 개의 토큰의 한계가 여전히 존재하는지 여부와 초대형 텍스트 출력과 같은 실제 응용 프로그램 문제를 처리하는 방법과 같은 일부 특정 문제에 대해 우려를 표명했습니다.
업계 분석가들은 이러한 획기적인 진행 상황이 AI 분야에 대한 Google의 장기 투자가 결과를 거두기 시작했음을 보여줍니다. 흥미롭게도,이 모델은 스타일 제어에서 4 위를 유지하는데, 이는 개발 팀이 사전 훈련 모델을 변경하는 대신 새로운 사후 훈련 접근법을 채택했음을 암시 할 수 있습니다.
이 주요 획기적인 혁신은 또한 산업 구조에 대한 토론을 촉발했습니다. OpenAi는 경쟁 업체가 중요한 업데이트를 발표했을 때 새로운 제품을 출시했지만 이번에는 Google의 진행 상황이 업계의 관심을 끌었습니다. 어떤 사람들은 이것이 Gemini2의 도착을 예고 할 수 있다고 믿고 있으며, 큰 모델 분야에서 Google의 경쟁력은 크게 향상되고 있습니다.
Gemini-EXP-1114의 뛰어난 성능은 AI 분야에서 Google의 강력한 강점을 보여줄뿐만 아니라 미래에 기대할 가치가있는 대형 모델 기술의 미래 개발 방향에 대한 새로운 영감을 제공합니다.