Disney Researchチームは最近、画質を確保しながらデータ送信レートを大幅に削減する革新的な画像圧縮テクノロジーを発表しました。このテクノロジーは、量子化エラーとノイズ処理を巧みに組み合わせることにより、より現実的な画像の詳細を低ビットレートで再構築し、競合他社よりもユーザーエクスペリエンステストの評価が高いと考えています。 JPEGやAV1などの従来のコーデックと比較して、それらの複雑さは改善されていますが、画質と処理効率の利点はより重要であり、画像ストレージと伝送の分野にとって非常に重要です。
Disney Researchは最近、低データ送信レートを維持しながら、より現実的な画像効果を生み出すことができる革新的な画像圧縮技術をリリースしました。
この新しいコーデックテクノロジーは、JPEGやAV1などの従来のコーデックと比較して複雑さを改善しましたが、画質と処理効率に大きな利点があります。研究チームは、量子化エラーと画像処理のノイズ処理を組み合わせることにより、ターゲットビットレートで画像の詳細をより適切に再構築できることを発見しました。
ディズニー圧縮法と以前の方法との比較。著者は、詳細回復が改善され、数十万ドルのトレーニングを必要としないモデルを提供し、最も近い同等の競争方法よりも速く実行されると主張しています。
研究者は、新しいテクノロジーには完全な処理プロセスの10%未満しか必要としないため、システムアーキテクチャに大きな変更を必要としないと述べました。実際のテストでは、このテクノロジーによって再構築された画質は、他の圧縮方法がビットレートの2倍を使用していても、エンドユーザーにさらに人気があります。
ただし、この技術にはいくつかの制限もあります。特定の特定の場合、再構築された画像は、直線のわずかな曲線や小さなオブジェクトの境界のわずかな歪みなど、微妙な不正確さを経験する可能性があります。これらの問題は、主にシステムの機能寸法の制限に起因しています。
実際のアプリケーションテストでは、研究チームは、Kodak、Clic2022、Coco30Kなど、評価に複数のデータセットを使用しました。評価インジケーターは、ピーク信号対雑音比(PSNR)、学習知覚類似性インデックス(LPIPS)、マルチスケール構造類似性インデックス(MSSIM)、Fréchet初期距離(FID)などの複数の次元を対象としています。
さらに、ディズニーの新しいアプローチ(グリーンで強調表示されている)と他のアプローチを比較します。
ユーザーリサーチは必須の選択方法を採用し、チェスチャンピオンシップと同様のエロレーティングシステムを通じて評価されます。結果は、競合他社が2倍のデータを使用していても、ディズニーの新しいテクノロジーが依然としてユーザーの評価が大幅に高いことを示しています。
処理速度の観点から、新しいテクノロジーは主要な競合他社と比較して大幅に改善されており、処理時間は6.87秒に短縮されて3.49秒になりました。この効率の改善は、優れた圧縮効果と相まって、このテクノロジーが画像ストレージと伝送の分野で重要なアプリケーション値を持つようになります。
画像圧縮技術の開発は、グローバルなデータストレージ、ストリーミングメディア送信、エネルギー消費などの問題を解決するために非常に重要であることに注意してください。最高のテクノロジーソリューションは常に最も幅広い市場認識を得るとは限りませんが、このディズニーのイノベーションは、業界に効率とパフォーマンスのバランスをとるソリューションを提供します。
要するに、ディズニーの画像圧縮技術は、効率と画像品質に大きなブレークスルーをもたらし、画像処理の分野に新しい可能性をもたらし、将来の開発は楽しみにしています。