Google AI lanza Gemini 2.0 Flash: dos veces más rápido que Gemini 1.5 Pro

Autor：Eve Cole Fecha de actualización：2024-12-20 16:48:02

Google lanzó recientemente una actualización importante para el modelo Gemini AI: Gemini 2.0 Flash. El modelo ofrece mejoras significativas en velocidad y capacidades multimodales, procesando dos veces más rápido que su predecesor y admitiendo procesamiento en tiempo real de transmisiones de audio y video, así como generación de imágenes nativas. Esta actualización marca otro hito importante en la exploración continua de Google en el campo de la IA, brindando herramientas de IA más potentes a usuarios y desarrolladores.

El departamento de investigación de IA del gigante tecnológico Google lanzó recientemente la última versión del modelo Gemini AI: Gemini2.0Flash. Este nuevo modelo ofrece mejoras significativas en el rendimiento, especialmente en términos de velocidad de procesamiento y expansión de funcionalidad multimodal.

Los funcionarios dicen que los usuarios de Gemini en todo el mundo pueden acceder a la versión optimizada para chat seleccionando la versión experimental 2.0 Flash en la lista desplegable de modelos en la web de escritorio y móvil, y pronto estará disponible en la aplicación móvil de Gemini. A principios del próximo año, Gemini2.0 se ampliará a más productos de Google.

Un desarrollo clave en Gemini 2.0 Flash es su velocidad de procesamiento mejorada. Google dice que el nuevo modelo funciona dos veces más rápido que la generación anterior Gemini 1.5 Pro, al tiempo que muestra un mejor rendimiento en varias pruebas comparativas. Este aumento de velocidad significa que los usuarios disfrutarán de una potencia de procesamiento más eficiente y tiempos de respuesta más rápidos.

Además, Gemini2.0Flash también se ha ampliado para manejar diversos tipos de datos. El modelo ahora incluye una API multimodal en tiempo real capaz de procesar transmisiones de audio y video en tiempo real. Esto permite a los desarrolladores crear aplicaciones que aprovechan la entrada visual y de audio dinámica. Al mismo tiempo, el modelo también integra capacidades nativas de generación de imágenes, lo que permite a los usuarios crear y modificar imágenes a través de mensajes de texto conversacionales.

Además de estos avances principales, Gemini 2.0 Flash también incluye otras mejoras. La salida de audio nativa en varios idiomas ahora admite ocho voces diferentes, ampliando la accesibilidad global del modelo. Las mejoras en el soporte de herramientas y agentes permiten que los modelos interactúen de manera más eficiente con herramientas y sistemas externos para completar tareas más complejas.

En términos de tareas de ingeniería de software, Gemini2.0 Flash logró una puntuación del 51,8% en el punto de referencia SWE-bench Verified, que está diseñado para evaluar la competencia en codificación. Este resultado demuestra el potencial del modelo para ayudar a los desarrolladores en el proceso de generación, depuración y optimización del código.

Google está integrando Gemini2.0 Flash en sus propias herramientas de desarrollo. Jules, un nuevo agente de código impulsado por IA, aprovecha Gemini 2.0 Flash para ayudar a los desarrolladores de Google Colaboratory. Esta integración demuestra la aplicación práctica del modelo en un entorno de desarrollo.

Gemini2.0 Flash también incluye funciones relacionadas con el desarrollo responsable de la IA. La compatibilidad con 109 idiomas amplía la accesibilidad global del modelo. Todas las imágenes y salidas de audio generadas tienen marcas de agua SynthID integradas, lo que proporciona un mecanismo para rastrear fuentes y resolver posibles problemas relacionados con el contenido generado por IA.

El lanzamiento de Gemini 2.0 Flash representa un paso más en el desarrollo de los modelos de IA de Google. Centrarse en aumentar la velocidad, ampliar las capacidades multimodales y mejorar la interacción de las herramientas contribuye a sistemas de IA más versátiles y potentes.

A medida que Google continúa desarrollando la familia de modelos Gemini, se esperan mayores refinamientos y ampliaciones de capacidades. Gemini2.0Flash contribuye al avance continuo de la tecnología de inteligencia artificial y sus posibles aplicaciones en diversos campos.

Introducción oficial: https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#gemini-2-0-flash

Destacar:

? Gemini2.0 Flash es dos veces más rápido que la generación anterior y su rendimiento ha mejorado significativamente.

?️ El modelo agrega una API multimodal en tiempo real para admitir el procesamiento en tiempo real de transmisiones de audio y video.

?️ Función integrada de generación de imágenes nativas, crea y modifica imágenes a través de indicaciones de texto.

El lanzamiento de Gemini 2.0 Flash presagia un nuevo avance en la velocidad y la aplicación multimodal de la tecnología de IA. También vale la pena esperar su potencial de aplicación en varios campos. La innovación continua de Google en el campo de la IA también es digna de atención.