中国の研究チームは大きなブレークスルーを行い、これに基づいて最大の公開マルチモーダルAIデータセット「Infinity-MM」を成功裏に作成し、優れたパフォーマンスAquila-VL-2Bで小さなモデルを訓練しました。このデータセットには、GPT-4などのAIモデルによって生成された大規模な画像の説明、視覚的命令データ、およびデータの品質と多様性を確保するために含まれています。 Aquila-VL-2Bモデルは、20億パラメーターしかない複数のベンチマークテストで優れた結果を達成していますが、MMSTAR基本テストでは54.9%であり、数学と画像の理解タスクでも優れています合成データを効果的に使用すると、モデルのパフォーマンスは2.4%向上しました。さらに重要なことは、データセットとモデルが研究コミュニティに開かれ、オープンソースAIの開発を推進していることです。
この研究結果は、Aquila-VL-2Bの成功とInfinity-MM Datasetのオープンの成功をグローバルAI研究コミュニティに提供して、マルチモーダルAIを促進するための貴重なリソースを提供します。 。 Infinity-MM PaperとAquila-VL-2Bプロジェクトを利用できます。関連するリンクをご覧ください。