これは、畳み込みニューラルネットワーク(CNN)を使用して5つの女性の顔形状を識別する画像分類プロジェクトです。これを、総会(2020年10月)のデータサイエンス没入コースのための私のキャップストーンプロジェクトとして完了しました。
このプロジェクトは、HerokuでStremlitを使用してWebアプリとして展開されています。興味がある場合は、myfaceshape.herokuapp.comで顔の形を確認してください
デロイトの消費者レビューに基づいて、消費者はよりパーソナライズされた経験を要求していますが、試験は低いままです。美容およびファッション業界では、16〜39歳の成人の40%以上がパーソナライズされたオファーに関心を持っていますが、トライアルはわずか10%〜14%です。興味を持っている人の中で、〜80%が少なくとも10%高い価格を支払うことをいとわない。
フェイスシェイプを分類できることにより、ブランドはよりパーソナライズされたソリューションを提供して顧客満足度を高め、プレミアムポジショニングからマージンを増やします。ユースケースの例は次のとおりです。
このプロジェクトでは、畳み込みニューラルネットワーク(CNN)を使用してディープラーニングアプローチを使用して、5つの異なる女性の顔の形(心臓、長方形、楕円形、円形、正方形)を分類します。最高の精度スコアであるモデルが選択されます。
VGG-16アーキテクチャとVGGFACEの事前訓練を受けたウェイトを使用して、ゼロから統制vs. Trasfer学習を構築することにより、CNNの2つのアプローチを調査しました。トランスファーラーニングアプローチは、最も誤分類された顔の形は「楕円形」である一方で、精度の向上に役立ちました。
画像の前処理は、過剰適合と検証精度を低下させる上で重要な役割を果たしました。主なドライバーは次のとおりです。
フェイスシェイプデータセットは、Niten LamaによるKaggleのデータセットです。
このデータセットは、世界中の女性の有名人の合計5000枚の画像で構成されています。
各カテゴリは1000枚の画像で構成されています(トレーニング用800:テスト用)
画像の前処理は、トレーニングデータセットへの過剰適合を削減し、検証の精度を向上させる重要な要因です。次の手順が調査されています。
4000画像の限られたトレーニングデータ(800画像x 5クラス)でゼロから構築されたCNNモデルは、4つの畳み込み +最大プーリング層と2つの密度層でモデルを構築します(詳細は以下)。
転送学習を備えたCNNモデルにより、 260万枚以上の画像でトレーニングされているVGGFaceの事前に訓練された重みを使用することにより、より複雑なVGG-16アーキテクチャを使用できます。
転送学習は、より大きなデータセットで事前に訓練されたウェイトの助けを借りて、76.9%から92.7%に精度を大幅に改善するのに役立ちました。
ゼロから構築されたモデルから、すべてのモデルは20%のベースラインよりも優れたパフォーマンスを発揮しました(5つのクラスはそれぞれ20%のバランスをとります)。
以下のすべてのモデルの概要。
両方のモデルは、楕円形の顔の形で最も誤分類されています。トランスファーラーニングモデルはゼロから構築されたモデルの精度を改善しましたが、楕円形は依然として最も誤分類されており、大部分は楕円形の誤分類を担当しています。興味深いことに、丸い顔も楕円形として誤分類されていますが、丸い顔の形の全体的な誤分類は低いです。楕円形と丸いの間の混乱は、ほとんどがアジアの顔であり、転送学習でもそうです。これは、前提条件の重みがアジアの画像が少ないためになる可能性があります。