Google lanzó recientemente tres nuevos modelos AI de la serie Gemini 2.0: la versión básica de Gemini 2.0 Flash, la versión económica de Gemini 2.0 Flash-Lite y la versión experimental de Gemini 2.0 Pro, con el objetivo de satisfacer las diferentes necesidades de diferentes usuarios y desarrolladores para rendimiento y costo. Estos tres modelos tienen su propio énfasis en la funcionalidad y el precio, marcando otro hito en el avance continuo de Google en el campo de los modelos de idiomas grandes. El artículo explicará las características, el rendimiento y las estrategias de precios de estos tres modelos en detalle, y hará predicciones preliminares en la dirección de desarrollo futura de Google en el campo de la IA.
Google ha ampliado su familia AI Model y lanzó tres nuevas versiones de modelos Gemini2.0, a saber, la versión básica de Gemini2.0flash, la versión económica de Gemini2.0flash-Lite y la versión experimental de Gemini2.0Pro. Estos nuevos modelos están diseñados para satisfacer diferentes necesidades de uso y proporcionar un equilibrio diversificado entre el rendimiento y el costo.
La versión básica de Gemini2.0flash se lanzó por primera vez en diciembre del año pasado y ahora se lanzó por completo, con límites de frecuencia de uso más altos y un mejor rendimiento. Gemini2.0flash-Lite es una variante de bajo costo para los desarrolladores y actualmente se está observando públicamente a través de la API.
Gemini2.0Pro es un modelo experimental diseñado para tareas complejas de solicitud y codificación, con una ventana de contexto que se expande a 2 millones de marcadores, el doble que la versión Flash.
Actualmente, estos modelos solo admiten la salida de texto, y Google planea agregar capacidades de imagen, audio y video en vivo a los modelos Flash y Pro en los próximos meses. Además, los tres modelos pueden procesar imágenes y audio como entradas.
En términos de pruebas, Google comparó el rendimiento de Gemini2.0Pro, y los resultados mostraron que superó a los modelos anteriores en casi todas las áreas. En la tarea de matemáticas, Gemini2.0Pro obtuvo un 91.8% en el punto de referencia de matemáticas, mientras que Hiddenmath obtuvo un 65.2%, superando con creces el rendimiento de la versión Flash.
Gemini2.0flash obtuvo un 29.9% en la prueba SimpleQA de OpenAI, mientras que el modelo PRO obtuvo un 44.3%. Esto muestra que Gemini2.0Pro tiene mayor precisión al responder preguntas complejas.
Vale la pena señalar que Google ha ajustado sus precios de API, eliminando las diferencias anteriores entre consultas de texto cortas y largas. Esto significa que las cargas de trabajo híbridas (texto e imágenes) pueden costar menos que la versión Gemini1.5flash, aunque mejoras de rendimiento. En términos de precio específico, la tarifa para Gemini2.0flash se establece en US $ 0.075 por millón de entrada y la salida es de US $ 0.4. El relativamente barato Gemini2.0flash-Lite cuesta $ 0.075 por entrada de texto, imagen y video y $ 0.30 para la salida de texto.
Si bien Gemini2.0flash tiene un precio más alto que las generaciones anteriores, el nuevo modelo Flash-Lite ofrece un mejor rendimiento al mismo precio, con el objetivo de llenar el vacío entre el precio y el rendimiento.
Además, Google ha actualizado la aplicación Gemini y ha abierto completamente las funciones de la serie Gemini, con el objetivo de proporcionar a los usuarios una experiencia de usuario más rica.
Todos los modelos están disponibles en dispositivos de escritorio y móviles a través de Google AI Studio y Vertex AI y el avanzado chatbot avanzado de Google Gemini.
Blog oficial: https://blog.google/technology/google-deepmind/gemini-model-updates-february-2025/
Puntos clave:
Google ha lanzado tres nuevos modelos Gemini2.0, incluidos Flash, Flash-Lite y Pro para satisfacer diferentes necesidades.
Gemini2.0Pro funcionó bien en las pruebas matemáticas y de precisión, con puntajes significativamente más altos que las generaciones anteriores.
Los ajustes de precios de API hacen que el costo de las cargas de trabajo híbridas sea más competitiva, mientras que Flash-Lite llena los vacíos en el mercado con un mejor rendimiento.
En resumen, el lanzamiento de la serie Gemini 2.0 de Google demuestra su innovación continua en el campo de los modelos de idiomas a gran escala y su comprensión precisa de la demanda diversificada del mercado. En el futuro, con la mejora de las funciones multimodales y la optimización de las estrategias de precios, se espera que la serie Gemini ocupe una posición más importante en el campo de la IA.