この記事では、EdgeSAM モデルとそのパフォーマンスの最適化、および EfficientSAM モデルのリリースについて紹介します。 EdgeSAM は iPhone 14 で大幅なパフォーマンスの向上を実現し、オリジナル モデルの 40 倍である 1 秒あたり 30 フレームに達します。このモデルは、純粋な CNN アーキテクチャを採用し、ヒント エンコーダー、マスク デコーダー、軽量モジュールなどのテクノロジーを導入することにより、モデルの精度を効果的に向上させ、データセットのバイアスの問題を解決します。さらに、動的プロンプト サンプリング戦略の適用により、モデルの効率と精度がさらに向上します。 EfficientSAM のリリースは、軽量セグメンテーション モデルの研究に貴重な経験を提供します。
EdgeSAM モデルは、iPhone 14 で 30 フレーム/秒で 40 倍のパフォーマンス向上を実現します。 ViT ベースの SAM 画像エンコーダを純粋な CNN アーキテクチャに最適化することで、エッジ デバイスに適合します。ヒント エンコーダー、マスク デコーダー、軽量モジュールを導入して、モデルの精度を向上させ、データセットのバイアスに対処します。動的なキュー サンプリング戦略を採用して、生徒モデルが特定の部分に焦点を当てるように導きます。同時に、SAM モデルの計算の複雑さを軽減し、軽量のセグメンテーション モデルに貴重なエクスペリエンスを提供するために、EfficientSAM がリリースされました。EdgeSAM と EfficientSAM の登場は、モバイル デバイスでの軽量セグメンテーション モデルの適用における大きな進歩を示し、エッジ コンピューティングの分野における将来の AI アプリケーションに新たな可能性を提供し、開発者により効果的なツールと経験から学ぶことを提供します。