Google abrió su último modelo de lenguaje Gemma2 en la conferencia I/O de Berlín, que ha atraído una gran atención por su excelente rendimiento y eficiencia. Gemma2 está disponible en tamaños de parámetros 9B y 27B, e incluso la versión 9B más pequeña muestra un rendimiento impresionante. Es particularmente digno de mención que el rendimiento de la versión 27B es cercano al del modelo Llama3 con parámetros 70B, pero es solo el 40% de su tamaño, lo que representa un avance significativo en la eficiencia del modelo. El código abierto de Gemma2 y su compatibilidad con múltiples marcos de IA proporcionarán a los desarrolladores e investigadores una poderosa herramienta para promover un mayor desarrollo en el campo de la IA.
En la conferencia Google I/O de Berlín no hace mucho, Google anunció que abriría su último modelo de lenguaje Gemma2, que ha logrado importantes avances en rendimiento y eficiencia. Gemma2 ofrece dos versiones con tamaños de parámetros 9B y 27B. El rendimiento de la versión 27B es cercano al modelo Llama3 con parámetros 70B, pero el tamaño del modelo es solo aproximadamente el 40% del último.
Las características clave de Gemma2 incluyen:
(1) Proporcionar tamaños de parámetros 9B y 27B
(2) Rendimiento de primera clase
(3) Capaz de realizar inferencias eficientes (ejecutándose en un único host NVIDIA H100GPU o TPU)
(4) Modelos fáciles de usar diseñados para desarrolladores e investigadores
Además, Gemma2 tiene las siguientes características:
(1) Excelente rendimiento: el modelo 27B es comparable al modelo Llama3 70B, que tiene más del doble de tamaño
(2) Alta eficiencia: una sola GPU puede lograr una inferencia de total precisión
(3) Amplio soporte de hardware: desde portátiles para juegos hasta la nube
(4) Licencia abierta: también disponible para uso comercial
Diseño amigable para los desarrolladores
Para comodidad de los desarrolladores, Gemma2 es compatible con una variedad de marcos de IA convencionales, como Hugging Face, JAX, PyTorch y TensorFlow. Google también proporciona un nuevo Gemma2Cookbook con orientación y ejemplos de aplicaciones prácticas. Además, Google planea admitir una implementación sencilla de Gemma2 a través de Google Cloud Vertex AI en un futuro próximo.
En términos de desarrollo responsable de IA, Google ha lanzado una serie de iniciativas, que incluyen proporcionar un conjunto de herramientas de IA generativa responsable, un comparador LLM de código abierto (para evaluación de modelos) y planes para abrir la tecnología de marca de agua de texto SynthID. Google también prometió realizar rigurosas evaluaciones de seguridad y publicar los resultados.
Actualmente, los desarrolladores e investigadores pueden obtener el modelo Gemma2 de forma gratuita a través de Google AI Studio. Los pesos de los modelos también se pueden descargar desde las plataformas Kaggle y Hugging Face. Para los investigadores académicos, Google también ofrece un programa Google Cloud Credits, con fecha límite de solicitud el 9 de agosto.
Vale la pena señalar que Gemma2 superó al modelo QWen1.5 en la lista autorizada de LMSys, lo que demuestra aún más su potente rendimiento. Este gran logro traerá nuevas oportunidades y desafíos al campo de la IA y promoverá un mayor desarrollo de modelos de lenguaje de código abierto.
Dirección oficial de la experiencia: https://aistudio.google.com/app/prompts/new_freeform
Con todo, el código abierto de Gemma2 marca una nueva etapa en el desarrollo de modelos de lenguaje de código abierto a gran escala. Su rendimiento eficiente y facilidad de uso acelerarán la popularización y aplicación de la tecnología de IA y brindarán más posibilidades a la IA. comunidad. Esperamos que Gemma2 pueda desempeñar un papel en más campos en el futuro.