Snap Inc. は、大規模なコンピューティング能力を必要とせずにハイエンドの携帯電話で高解像度の画像を生成できるツール、SnapGen と呼ばれる AI 画像ジェネレーターを発売しました。これはモバイル AI 画像生成テクノロジーにとって大きな進歩であり、ユーザーは携帯電話で画像を便利かつ迅速に作成できるようになります。 SnapGen の核心は、コンパクトで効率的なモデル設計にあり、パラメータの数は人気のある画像ジェネレーター SDXL のわずか 7 分の 1 ですが、画質と生成速度において大きな利点があり、ユーザーによりスムーズで楽しいクリエイティブ エクスペリエンスをもたらします。
Snap Inc. の研究チームは最近、ハイエンドの携帯電話で高解像度の画像を直接生成できる SnapGen と呼ばれる人工知能画像ジェネレーターを発表しました。このテクノロジーの発表により、ユーザーは携帯電話で効率的かつ便利な画像作成体験を楽しむことができ、強力なコンピューティング能力を必要とする従来の AI 画像生成の制限を打ち破ることができます。
SnapGen の中核的な強みは、モデルのコンパクトさと効率にあります。 SDXL などの一般的な画像ジェネレータと比較すると、SnapGen のパラメータ数はわずか 3 億 7,900 万個で、約 7 分の 1 です。このコンパクトなデザインは、保管スペースが少ないだけでなく、動作速度の点でも優れています。テスト結果によると、SnapGen は画像とテキストの説明を一致させる能力で優れたパフォーマンスを示し、スコアは 0.66 で、SDXL の 0.55 を上回り、品質において明らかな優位性を示しました。
速度に関しては、SnapGen が際立っています。 iPhone 16 Pro Maxでは、解像度1024×1024ピクセルの高画質画像を約1.4秒で生成できます。この高速化により、ユーザーはクリエイティブ作業中に遅延をほとんど感じることなく、瞬時に画像生成の楽しさを体験することができます。
この一連のパフォーマンス向上を達成するために、研究チームはネットワーク アーキテクチャを体系的に再設計し、高品質の画像生成を確保しながらモデル パラメーターと遅延を合理化しました。デコーダセクションを特別に最適化して、同様のシステムよりも 36 分の 1 に小型化しました。さらに、小規模モデルのパフォーマンスを大規模モデルのレベルに到達させるために、チームは SD3 や SD3.5 などの大規模 AI システムの学習方法からも学び、状況に応じて動的に調整できる特別なトレーニング プロセスを開発しました。学習戦略の難しさ。
SnapGen の出現により、モバイル デバイス上の AI 画像生成テクノロジーは新たな進歩をもたらし、将来、ユーザーは携帯電話でより高速かつ高品質の画像作成を体験し、ソーシャル メディア コンテンツ作成の発展をさらに促進することになります。 。 進捗。
SnapGen の登場は、モバイル AI 画像生成テクノロジーの新たなマイルストーンを告げるものであり、ユーザーにより便利で強力な画像作成ツールを提供するとともに、ソーシャル メディア コンテンツ作成に無限の可能性をもたらします。その効率的なモデル設計と優れたパフォーマンスは、将来のモバイル AI 画像生成技術の開発の方向性をリードします。