アレン人工知能研究所は多くの大学と協力し、世界初の完全にオープンソースの大規模言語モデル OLMo を共同リリースしました。これは人工知能の分野における重要なマイルストーンであり、より透明性が高くオープンな大型モデル技術の開発が促進されることになる。 OLMo には、モデルの重み、コード、データ セット、および完全なトレーニング プロセスが含まれており、その 7B パラメーター バージョンは複数のタスクで適切に実行されます。さらに、研究チームは事前トレーニングデータセットDolmaも公開し、データの透明性を最大化するためのデータ照合および分析ツールを提供しました。これは、学界および産業界における大規模言語モデルの研究と応用を促進する上で広範な意義があります。
アレン人工知能研究所と複数の大学は、重み、コード、データ セット、トレーニング プロセス全体を含む世界初の 100% オープンソースの大規模モデル OLMo をリリースしました。性能評価では、OLMo-7B が多くのタスクでわずかに優れていることがわかります。同時に、研究者らは、言語モデルの事前トレーニング分野におけるオープン研究を促進するために、事前トレーニングデータセットDolmaを公開しました。データの透明性の観点から、データ照合ツールや分析ツールが提供されています。
OLMo のオープンソース リリースは、大規模モデル研究の敷居を下げるだけでなく、貴重なリソースを世界の人工知能コミュニティに提供し、よりオープンで協調的な人工知能エコシステムの到来を告げます。 今後、OLMoをベースにした革新的な応用や研究成果がさらに生まれることが期待されます。