NVIDIA lança Nemotron-4: modelo grande universal de 15 bilhões de parâmetros, alvo único A100/H100 pode ser executado
A NVIDIA lançou o Nemotron-4, um grande modelo de uso geral com 15 bilhões de parâmetros que funciona bem em vários idiomas e tarefas de codificação. O modelo adota a lei de escala do modelo Chinchilla para otimizar o orçamento de cálculo, os dados e o ta
2025-02-07