Allen AI a annoncé l'open source de son modèle affiné appelé OLMo-7B-Instruct, qui est construit sur l'ensemble de données Dolma d'AI2 et contient quatre variantes de modèle à l'échelle 7B, chaque modèle étant entraîné avec au moins 2T marqueurs. Cette initiative open source vise à promouvoir le développement de la recherche et de l'application de modèles. Allen AI fournit également une suite complète de poids, d'évaluation et de code de formation et d'évaluation pour permettre aux utilisateurs de comprendre pleinement l'ensemble du processus, depuis les modèles de pré-formation jusqu'au réglage fin du RLHF. modèles, fournissant aux chercheurs et aux développeurs des ressources précieuses.
Allen AI a récemment annoncé le modèle de réglage fin open source OLMo-7B-Instruct, construit sur l'ensemble de données Dolma d'AI2. Le modèle comprend les poids complets de quatre variantes de modèles à l'échelle 7B, chacune formée sur au moins des marqueurs 2T. Allen AI a également publié un kit d'évaluation à utiliser dans le développement, fournissant des codes de formation et d'évaluation, permettant aux utilisateurs d'avoir une compréhension complète de l'ensemble du processus, des modèles de pré-formation aux modèles de réglage fin RLHF, fournissant un soutien solide pour le développement de modèles. recherche et applications.
L'open source d'OLMo-7B-Instruct fournit non seulement de puissantes ressources de modèle, mais plus important encore, son code de support complet et ses outils d'évaluation, ce qui apporte une grande commodité à la recherche et à l'application de la communauté IA et favorise le développement de grands modèles. Avec un développement et une innovation continus, il vaut la peine d'attendre avec impatience ses performances dans les applications futures.