Экспериментальная версия Gemini от Google DeepMind (Exp1114) прекрасно работает на платформе Chatbot Arena! После тестирования сообщества, набравшего более 6000 голосов, он превзошел своих конкурентов в нескольких ключевых областях, особенно в математике, сложных подсказках и творческом письме, продемонстрировав высокие общие возможности. Редактор Downcodes даст вам более глубокое понимание выдающихся характеристик Gemini-Exp-1114 и их интерпретации в отрасли.
Последняя экспериментальная версия Gemini от Google DeepMind (Exp1114) добилась впечатляющих результатов на платформе Chatbot Arena. После более чем недели тестирования сообщества накопленные данные более 6000 голосов показывают, что эта новая модель превосходит конкурирующие продукты со значительными преимуществами и демонстрирует удивительную силу во многих ключевых областях.
По общему баллу Gemini-Exp-1114 разделил первое место с последней GPT-4 с отличной оценкой более 40 баллов, превзойдя ранее лидирующую предварительную версию GPT-4. Еще более удивительно то, что эта модель достигла вершины в таких основных областях, как математика, сложные подсказки и творческое письмо, продемонстрировав свою всеобъемлющую силу.
В частности, прогресс Gemini-Exp-1114 впечатляет:
Поднялся с 3-го на первое место в общем рейтинге.
Оценка способностей к математике поднялась с 3-го на 1-е место.
Сложная обработка подсказок поднялась с 4-го на 1-е место.
Показатели творческого письма улучшились со 2-го на 1-е место.
Возможности визуальной обработки также возглавляют список
Уровень программирования также улучшился с 5-го до 3-го.
Google AI Studio официально представила эту новую версию для пользователей. Тем не менее, сообщество также выразило обеспокоенность по поводу некоторых конкретных проблем, например, существует ли ограничение в 1000 токенов и как решать практические проблемы приложений, такие как вывод чрезвычайно длинного текста.
Отраслевые аналитики полагают, что этот прорыв показывает, что долгосрочные инвестиции Google в область искусственного интеллекта начинают приносить свои плоды. Интересно, что модель занимает 4-е место по контролю стиля, что может означать, что команда разработчиков в основном применяла новые методы после обучения, а не вносила изменения в предварительно обученную модель.
Этот крупный прорыв также вызвал дискуссии о структуре отрасли. OpenAI часто запускала новые продукты, когда конкуренты выпускали важные обновления, но на этот раз прогресс Google был настолько большим, что привлек внимание отрасли. Некоторые полагают, что это может ознаменовать появление Gemini2 и что конкурентоспособность Google в области крупных моделей значительно повышается.
Превосходная производительность Gemini-Exp-1114 знаменует собой еще один важный прорыв для Google в области крупных моделей искусственного интеллекта, а также открывает больше возможностей для будущей разработки искусственного интеллекта. Мы с нетерпением ждем новых сюрпризов в последующих версиях Gemini!