中国チームは、世界最大のマルチモーダルデータセット「Infinity-MM」とトップマイクロAIモデル「Aquila-VL-2B」-AI記事を宣伝しています

著者：Eve Cole 更新時間：2025-02-12 18:32:01

中国の研究チームは大きなブレークスルーを行い、これに基づいて最大の公開マルチモーダルAIデータセット「Infinity-MM」を成功裏に作成し、優れたパフォーマンスAquila-VL-2Bで小さなモデルを訓練しました。このデータセットには、GPT-4などのAIモデルによって生成された大規模な画像の説明、視覚的命令データ、およびデータの品質と多様性を確保するために含まれています。 Aquila-VL-2Bモデルは、20億パラメーターしかない複数のベンチマークテストで優れた結果を達成していますが、MMSTAR基本テストでは54.9％であり、数学と画像の理解タスクでも優れています合成データを効果的に使用すると、モデルのパフォーマンスは2.4％向上しました。さらに重要なことは、データセットとモデルが研究コミュニティに開かれ、オープンソースAIの開発を推進していることです。

この研究結果は、Aquila-VL-2Bの成功とInfinity-MM Datasetのオープンの成功をグローバルAI研究コミュニティに提供して、マルチモーダルAIを促進するための貴重なリソースを提供します。。 Infinity-MM PaperとAquila-VL-2Bプロジェクトを利用できます。関連するリンクをご覧ください。