O modelo de ajuste fino de código aberto Allen AI OLMo-7B-Instruct promove o desenvolvimento de pesquisa e aplicação de modelos

Autor：Eve Cole Data da Última Atualização：2025-01-05 19:32:01

Allen AI anunciou o código aberto de seu modelo ajustado chamado OLMo-7B-Instruct, que é construído no conjunto de dados Dolma da AI2 e contém quatro variantes de modelo em escala 7B, cada modelo treinado com pelo menos marcadores 2T. Esta iniciativa de código aberto visa promover o desenvolvimento de pesquisa e aplicação de modelos. Allen AI também fornece um peso completo, conjunto de avaliação e código de treinamento e avaliação para facilitar aos usuários a compreensão completa de todo o processo, desde os modelos de pré-treinamento até o ajuste fino do RLHF. modelos, fornecendo aos pesquisadores e desenvolvedores recursos valiosos.

Allen AI anunciou recentemente o modelo de ajuste fino de código aberto OLMo-7B-Instruct, construído no conjunto de dados Dolma da AI2. O modelo inclui os pesos totais de quatro variantes do modelo em escala 7B, cada uma treinada em pelo menos marcadores 2T. Allen AI também lançou um kit de avaliação para uso em desenvolvimento, fornecendo códigos de treinamento e avaliação, permitindo aos usuários ter uma compreensão abrangente de todo o processo, desde modelos de pré-treinamento até modelos de ajuste fino RLHF, fornecendo forte suporte para o desenvolvimento de modelo pesquisas e aplicações.

O código aberto do OLMo-7B-Instruct não apenas fornece recursos de modelo poderosos, mas, mais importante, seu código de suporte completo e ferramentas de avaliação, o que traz grande comodidade para a pesquisa e aplicação da comunidade de IA e promove o desenvolvimento de grandes modelos . Com desenvolvimento e inovação contínuos, vale a pena aguardar seu desempenho em aplicações futuras.