O modelo grande StableCode é uma ferramenta usada especificamente para desenvolver e implementar algoritmos e aplicativos de inteligência artificial. Ele pode ser executado em várias estruturas de aprendizado profundo e é adequado para tarefas como classificação de imagens, detecção de alvos e segmentação semântica.
A Stability AI é mais conhecida por seu modelo de imagem gerada por texto de difusão estável, mas essa não é sua única área de interesse, já que a empresa agora também está se ramificando na geração de código. Hoje, a Stability AI lançou seu novo modelo aberto de linguagem grande (LLM) StableCode, que foi projetado para ajudar os usuários a gerar código de linguagem de programação e é baseado na rede neural do transformador.
StableCode oferecerá três níveis diferentes: um modelo básico para uso geral, um modelo de instrução e um modelo de janela de contexto longa capaz de suportar até 16.000 tokens.
O modelo StableCode se beneficia do conjunto de dados da linguagem de programação inicial do projeto BigCode de código aberto e também passa por filtragem adicional e ajuste fino pelo Stability AI. O StableCode inicialmente suportará o desenvolvimento em linguagens de programação como Python, Go, Java. , JavaScript, C, marcação e C++.
O treinamento de qualquer LLM depende de dados, e os dados para StableCode vêm do projeto BigCode. HuggingFace e ServiceNow também lançaram StarCoder LLM aberto baseado em BigCode em maio. Nathan Cooper, cientista-chefe de pesquisa da Stability AI, disse que o treinamento do StableCode envolve extensa filtragem e limpeza de dados do BigCode.
A janela de contexto longa do StableCode tem uma janela de contexto de 16.000 tokens, que o Stability AI afirma ser maior do que qualquer outro modelo. A janela de contexto mais longa permite o uso de prompts de geração de código mais profissionais e complexos. base de código de tamanho grande contendo vários arquivos para ajudar a compreender e gerar novo código.
O StableCode ainda está em seus estágios iniciais e o objetivo oficial agora é ver como os desenvolvedores aceitarão e usarão o modelo.