O Google abriu o código-fonte de seu mais recente modelo de linguagem Gemma2 na conferência I/O de Berlim, que atraiu ampla atenção por seu excelente desempenho e eficiência. Gemma2 está disponível em tamanhos de parâmetros 9B e 27B, e até mesmo a versão menor 9B apresenta desempenho impressionante. É particularmente digno de nota que o desempenho da versão 27B é próximo ao do modelo Llama3 com parâmetros 70B, mas é apenas 40% do seu tamanho, o que é um avanço significativo na eficiência do modelo. O código aberto e a compatibilidade do Gemma2 com múltiplas estruturas de IA fornecerão aos desenvolvedores e pesquisadores uma ferramenta poderosa para promover um maior desenvolvimento no campo da IA.
Na conferência Google I/O Berlin, há pouco tempo, o Google anunciou que abriria o código-fonte de seu mais recente modelo de linguagem Gemma2, que alcançou grandes avanços em desempenho e eficiência. Gemma2 oferece duas versões com tamanhos de parâmetros 9B e 27B. O desempenho da versão 27B é próximo ao modelo Llama3 com parâmetros 70B, mas o tamanho do modelo é apenas cerca de 40% deste último.
Os principais recursos do Gemma2 incluem:
(1) Fornece tamanhos de parâmetro 9B e 27B
(2) Desempenho de primeira classe
(3) Capaz de realizar inferência eficiente (executando em um único host NVIDIA H100GPU ou TPU)
(4) Modelos fáceis de usar projetados para desenvolvedores e pesquisadores
Além disso, Gemma2 possui os seguintes recursos:
(1) Excelente desempenho: O modelo 27B é comparável ao modelo Llama3 70B, que tem mais de 2 vezes o tamanho
(2) Alta eficiência: uma única GPU pode obter inferência de precisão total
(3) Amplo suporte de hardware: de laptops para jogos à nuvem
(4) Licença aberta: também disponível para uso comercial
Design amigável ao desenvolvedor
Para conveniência dos desenvolvedores, Gemma2 é compatível com uma variedade de estruturas de IA convencionais, como Hugging Face, JAX, PyTorch e TensorFlow. O Google também fornece um novo Gemma2Cookbook com exemplos práticos de aplicação e orientações. Além disso, o Google planeja oferecer suporte à implantação fácil do Gemma2 por meio do Google Cloud Vertex AI em um futuro próximo.
Em termos de desenvolvimento responsável de IA, o Google lançou uma série de iniciativas, incluindo o fornecimento de um kit de ferramentas de IA generativo responsável, comparador LLM de código aberto (para avaliação de modelo) e planos para tecnologia de marca d'água de texto SynthID de código aberto. O Google também prometeu realizar avaliações de segurança rigorosas e publicar os resultados.
Atualmente, desenvolvedores e pesquisadores podem obter o modelo Gemma2 gratuitamente por meio do Google AI Studio. Os pesos dos modelos também podem ser baixados das plataformas Kaggle e Hugging Face. Para pesquisadores acadêmicos, o Google também oferece um programa Google Cloud Credits, com prazo de inscrição até 9 de agosto.
É importante notar que o Gemma2 superou o modelo QWen1.5 na lista oficial da LMSys, comprovando ainda mais seu desempenho poderoso. Esta conquista inovadora trará novas oportunidades e desafios para o campo da IA e promoverá o desenvolvimento de modelos de linguagem de código aberto.
Endereço oficial da experiência: https://aistudio.google.com/app/prompts/new_freeform
Em suma, o código aberto do Gemma2 marca uma nova etapa no desenvolvimento de modelos de linguagem de código aberto em grande escala. Seu desempenho eficiente e facilidade de uso irão acelerar a popularização e aplicação da tecnologia de IA e trazer mais possibilidades para a IA. comunidade. Esperamos que a Gemma2 possa desempenhar um papel em mais campos no futuro.