国内のAI会社Deepseekは、Janus-Proマルチモーダルモデルをリリースし、文学と伝記のグラフィックスの分野に正式に参入し、驚くべき結果を達成しました。この製品は、Janusflowモデルのアップグレードに基づいて、複数のベンチマークでOpenaiのDall-E3などの有名なモデルを上回りました。 Deepseekの動きは、マルチモーダルAIテクノロジーの大きなブレークスルーを示し、国内のAIの開発に新しい活力を注入します。
国内のビッグモデルDeepseekは、新しいJanus-Proマルチモーダルビッグモデルをリリースし、文学と伝記のグラフィックスの分野に正式に入ります。この動きは、マルチモーダルAIテクノロジーのDeepSeekの大きなブレークスルーを示しています。
GenevalおよびDPGベンチのベンチマークでは、Janus-Pro-7BはOpenaiのDall-E3を破るだけでなく、安定した拡散やEMU3-Genなどの一般的なモデルを上回ります。 Janus-ProはMITオープンソースプロトコルを採用しています。つまり、制限なしにコマーシャルシナリオで使用できます。 Deepseekは、Janus-Proは2024年11月13日にリリースされたJanusflow Mockupのプレミアムバージョンであると述べました。
前世代モデルと比較して、Janus-Proはトレーニング戦略を最適化し、トレーニングデータを拡大し、モデルスケールが大きくなりました。これらの改善により、Janus-Proはマルチモーダルの理解とテキストからイメージまでの命令追跡機能を大幅に進め、テキストから画像への生成の安定性を高めました。
Janus-Proは384x384の解像度で画像のみを処理できますが、コンパクトモデルサイズを考えると、このようなレベルに到達できることはすでに驚くべきことです。
マルチモーダルモデルとして、Janus-Proは画像を生成するだけでなく、画像を説明し、画期的なアトラクションを識別し、画像のテキストを識別し、画像に知識を紹介することもできます。
ポイント:
Deepseekは、Janus-Proマルチモーダルモデルをリリースして、文学と伝記のグラフィックスの分野に入ります。
ベンチマークでは、Janus-Pro-7Bパフォーマンスは、OpenaiのDall-E3などの一般的なモデルを上回ります。
Janus-ProはMITオープンソースプロトコルを使用しており、制限なしにコマーシャルシナリオで使用できます。
Janus-Proの出現は、文学的および伝記的な写真の分野における国内の大きなモデルの技術的強さが急速に上昇していることを示しています。に!