Google Gemini Exp 1114 est né ! GPT-4 écrasé lors de la première bataille, atteignant le sommet dans plusieurs évaluations de capacités et choquant l'industrie

Auteur：Eve Cole Date de mise à jour：2025-01-28 08:48:02

La version expérimentale Gemini de Google DeepMind (Exp1114) fonctionne à merveille sur la plateforme Chatbot Arena ! Après des tests communautaires avec plus de 6 000 votes, il a surpassé ses concurrents dans plusieurs domaines clés, notamment les mathématiques, les invites complexes et l'écriture créative, démontrant ainsi de solides capacités globales. L'éditeur de Downcodes vous donnera une compréhension approfondie des performances exceptionnelles du Gemini-Exp-1114 et de l'interprétation qu'en fait l'industrie.

La dernière version expérimentale Gemini de Google DeepMind (Exp1114) a obtenu des résultats impressionnants sur la plateforme Chatbot Arena. Après plus d'une semaine de tests communautaires, les données accumulées de plus de 6 000 votes montrent que ce nouveau modèle surpasse les produits concurrents avec des avantages significatifs et fait preuve d'une force étonnante dans de nombreux domaines clés.

En termes de score global, Gemini-Exp-1114 est à égalité avec GPT-4-latest à la première place avec un excellent score de plus de 40 points, surpassant la version préliminaire de GPT-4, précédente en tête. Ce qui est encore plus étonnant, c'est que ce modèle a atteint le sommet dans des domaines fondamentaux tels que les mathématiques, les invites complexes et l'écriture créative, démontrant ainsi sa forte force globale.

Plus précisément, les progrès de Gemini-Exp-1114 sont impressionnants :

Passé de la 3ème à la première place au classement général

L'évaluation des capacités en mathématiques est passée de la 3e à la 1re

Le traitement rapide complexe est passé de la 4e à la 1re place

Performances d'écriture créative améliorées de la 2e à la 1re place

Les capacités de traitement visuel sont également en tête de liste

Le niveau de programmation s'est également amélioré du 5ème au 3ème

Google AI Studio a officiellement lancé cette nouvelle version pour que les utilisateurs puissent en faire l'expérience. Cependant, la communauté a également exprimé ses inquiétudes sur certains problèmes spécifiques, tels que la question de savoir si la limite de 1 000 jetons existe toujours et comment gérer les problèmes d'application pratiques tels que la sortie de texte extrêmement long.

Les analystes du secteur estiment que cette avancée montre que l’investissement à long terme de Google dans le domaine de l’IA commence à porter ses fruits. Il est intéressant de noter que le modèle maintient un classement au 4ème rang en termes de contrôle de style, ce qui peut impliquer que l'équipe de développement a principalement adopté de nouvelles méthodes post-formation plutôt que d'apporter des modifications au modèle pré-entraîné.

Cette avancée majeure a également déclenché des discussions sur la structure de l’industrie. OpenAI a souvent lancé de nouveaux produits lorsque ses concurrents publiaient des mises à jour importantes, mais cette fois, les progrès de Google ont été si importants qu'ils ont attiré l'attention de l'industrie. Certains pensent que cela pourrait annoncer l'arrivée de Gemini2 et que la compétitivité de Google dans le domaine des grands modèles s'améliore considérablement.

Les excellentes performances du Gemini-Exp-1114 marquent une nouvelle avancée majeure pour Google dans le domaine des grands modèles d'IA et offrent également davantage de possibilités pour le développement futur de l'IA. Nous attendons avec impatience d’autres surprises dans les versions ultérieures de Gemini !