アリババは最近、マルチモーダル大型モデル Qwen-VL-Plus と Qwen-VL-Max の 2 つのバージョンをリリースしました。どちらのバージョンも、テキスト画像タスクと視覚的推論において大きな進歩を遂げており、現在の業界をリードする GPT-4V と Gemini のパフォーマンスを上回っています。この動きは、アリババがマルチモーダル大型モデル分野における技術競争の新たな段階を示し、この分野での強力な技術力と革新能力を実証し、将来の AI アプリケーションの開発に新たな可能性をもたらしました。
Alibaba は、Qwen-VL-Plus および Qwen-VL-Max バージョンを発売しました。これらは、それぞれテキスト画像タスクと視覚的推論で大幅な進歩を遂げ、GPT-4V と Gemini を上回りました。これは、マルチモーダル モデルの分野における技術アップグレードの新たな段階を示します。
Qwen-VL-Plus と Qwen-VL-Max のリリースは、マルチモーダル AI テクノロジーの幅広い応用を予告し、あらゆる階層にイノベーションと効率向上のより多くの機会をもたらします。 アリババの人工知能分野における継続的な投資と技術的進歩は、期待に値します。将来的には、Qwen-VL シリーズ モデルをベースにしたさらに革新的なアプリケーションが登場するでしょう。