このプロジェクトは、電子商取引の顧客セグメンテーションにおける次のマーケティング戦略に Generative AI を活用することを目的としています。
このリポジトリは、いくつかのファイルで構成されています。
┌── Backend/
│ ├── model/
│ | ├── model.pkl
│ | ├── model.py
│ ├── ai.py
│ ├── ai_response.txt
│ ├── app.py
│ ├── dockerfile
│ ├── requirements.txt
├── Frontend/
│ ├── app.py
│ ├── df_customer.csv
│ ├── df_segment.csv
│ ├── dockerfile
│ ├── ecommerce-cluster.csv
│ ├── requirements.txt
├── docker-compose.yml
├── notebook.ipynb
└── README.md
backend/ model/ model.pkl
: このファイルは、クラスタリング ケース用にトレーニングされた機械学習モデルです。
backend/ model/ model.py
: このファイルには、保存されたファイルからトレーニング済みの機械学習モデルをロードするコードが含まれています。
backend/ ai.py
: このファイルには、生成 AI のバックエンド コードが含まれています。
backend/ ai_respones.txt
: このファイルには、顧客セグメントごとに保存された AI 応答が含まれています。
backend/ app.py
: このファイルには、アプリケーションのバックエンド コードが含まれています。サーバー側ロジック、API エンドポイント、またはその他のバックエンド機能の処理を担当します。
backend/ dockerfile
: Dockerfile は、バックエンド アプリケーションの Docker イメージを構築するために使用されます。これには、バックエンドに必要な環境と依存関係をセットアップする方法に関する手順が含まれています。
backend/ requirements.txt
: このファイルには、バックエンド アプリケーションに必要な Python の依存関係がリストされています。これらの依存関係は、pip などのパッケージ マネージャーを使用してインストールできます。
frontend/ app.py
: このファイルはアプリケーションのフロントエンドのメイン スクリプトであり、Streamlit フレームワークを使用して開発されます。これには、ユーザー入力のセクションと、API 呼び出しによるバックエンド機能の統合が含まれています。
frontend/ df_customer.csv
: この CSV ファイルは探索的データ分析の結果であり、クラスタリング用のモデルをトレーニングするために使用されます。
frontend/ df_segment.csv
: この CSV ファイルはクラスタリングの結果です。
frontend/ dockerfile
: バックエンド Dockerfile と同様に、このファイルはフロントエンド アプリケーションの Docker イメージを構築するために使用されます。これには、環境のセットアップと依存関係のインストールに関する手順が含まれています。
frontend/ ecommerce-cluster.csv
: この CSV ファイルは、Google BigQuery からのクエリの結果です。
frontend/ requirements.txt
: このファイルには、フロントエンド アプリケーションに必要な Python の依存関係がリストされています。これらの依存関係は、pip などのパッケージ マネージャーを使用してインストールできます。
docker-compose.yml
: これは、Docker Compose の構成ファイルです。アプリケーションのコンテナのサービス、ネットワーク、ボリュームを定義します。 Docker Compose は、複数コンテナー アプリケーションを実行するプロセスを簡素化します。
README.md
: これは、通常、プロジェクトのドキュメントが含まれるマークダウン ファイルです。これには、アプリケーションのセットアップ方法と実行方法、依存関係、その他の関連詳細に関する情報が含まれます。
notebook.ipynb
: この Jupyter Notebook ファイルには、Google Cloud の Vertex AI を使用した機械学習タスクに関連するコード、分析、またはドキュメントが含まれています。
このプロジェクトの流れは、データセットの基本構造を理解するための探索的データ分析 (EDA) から始まります。次に、歪みスコア エルボーとシルエット スコアに基づいてセグメントの数を決定します。その後、モデルをトレーニングし、K-Means クラスタリングを使用して予測を行います。クラスタリングの結果、特定の特徴を持つ 5 つの顧客セグメントが明らかになります。次に、生成 AI を使用して、顧客セグメントごとにマーケティング戦略のステップを決定します。
探索的データ分析 (EDA) を実施し、支出パターン、注文頻度、返品率に基づいて顧客を 5 つの異なるグループに分類した後、Generative AI を使用して各セグメントに合わせたマーケティング戦略を考案しました。
セグメント 1: 中程度の支出 (52.75 ~ 112.75)、平均 74.31 ドル、1 人当たりの平均注文数 2.27 の顧客。推奨されるマーケティング戦略は、リピート購入を促すためにパーソナライズされた推奨事項を提供することです。
セグメント 2: 支出額が高い顧客 (112.75 ~ 233.00)、平均 150.89 ドル、1 人あたり平均 1.67 件の注文。推奨されるマーケティング戦略は、リピート購入に報いるロイヤルティ プログラムを導入することです。
セグメント 3: 高額支出の顧客 (558.75 ~ 999.00)、平均 801.13 ドル、1 人あたり平均 1.01 件の注文があります。推奨されるマーケティング戦略は、プレミアムなショッピング体験を強化するために、独占的なハイエンド製品またはサービスを提供することです。
セグメント 4: 低支出の顧客 (0.02 ~ 52.78)、平均 31.24 ドル、1 人あたり平均 1.85 件の注文。推奨されるマーケティング戦略は、顧客維持率を高めるためにサブスクリプション サービスやバンドル取引を導入することです。
セグメント 5: 多額の支出 (233.66 から 550.00)、平均 314.91 ドル、1 人あたりの平均注文数 1.44 の顧客。推奨されるマーケティング戦略は、特別な VIP イベントやエクスペリエンスを作成して、価値の高い顧客を評価し維持することです。