본 프로젝트는 전자상거래 고객 세분화 시 차세대 마케팅 전략으로 Generative AI를 활용하는 것을 목표로 합니다.
이 저장소는 여러 파일로 구성됩니다.
┌── Backend/
│ ├── model/
│ | ├── model.pkl
│ | ├── model.py
│ ├── ai.py
│ ├── ai_response.txt
│ ├── app.py
│ ├── dockerfile
│ ├── requirements.txt
├── Frontend/
│ ├── app.py
│ ├── df_customer.csv
│ ├── df_segment.csv
│ ├── dockerfile
│ ├── ecommerce-cluster.csv
│ ├── requirements.txt
├── docker-compose.yml
├── notebook.ipynb
└── README.md
backend/ model/ model.pkl
: 이 파일은 클러스터링 사례에 대해 훈련된 기계 학습 모델입니다.
backend/ model/ model.py
: 이 파일에는 저장된 파일에서 훈련된 기계 학습 모델을 로드하는 코드가 포함되어 있습니다.
backend/ ai.py
: 이 파일에는 생성 AI에 대한 백엔드 코드가 포함되어 있습니다.
backend/ ai_respones.txt
: 이 파일에는 각 고객 세그먼트에 대해 저장된 AI 응답이 포함되어 있습니다.
backend/ app.py
: 이 파일에는 애플리케이션의 백엔드 코드가 포함되어 있습니다. 서버 측 로직, API 엔드포인트 또는 기타 백엔드 기능을 처리하는 역할을 담당합니다.
backend/ dockerfile
: Dockerfile은 백엔드 애플리케이션용 Docker 이미지를 빌드하는 데 사용됩니다. 여기에는 백엔드에 필요한 환경 및 종속성을 설정하는 방법에 대한 지침이 포함되어 있습니다.
backend/ requirements.txt
: 이 파일에는 백엔드 애플리케이션에 필요한 Python 종속성이 나열되어 있습니다. 이러한 종속성은 pip와 같은 패키지 관리자를 사용하여 설치할 수 있습니다.
frontend/ app.py
: 이 파일은 애플리케이션 프런트엔드의 기본 스크립트이며 Streamlit 프레임워크를 사용하여 개발되었습니다. 여기에는 사용자 입력을 위한 섹션과 API 호출을 통한 백엔드 기능 통합이 포함되어 있습니다.
frontend/ df_customer.csv
: 이 CSV 파일은 탐색적 데이터 분석의 결과이며 클러스터링을 위한 모델을 훈련하는 데 사용됩니다.
frontend/ df_segment.csv
: 이 CSV 파일은 클러스터링의 결과입니다.
frontend/ dockerfile
: 백엔드 Dockerfile과 유사하며 이 파일은 프런트엔드 애플리케이션용 Docker 이미지를 빌드하는 데 사용됩니다. 여기에는 환경 설정 및 종속성 설치에 대한 지침이 포함되어 있습니다.
frontend/ ecommerce-cluster.csv
: 이 CSV 파일은 Google BigQuery의 쿼리 결과입니다.
frontend/ requirements.txt
: 이 파일에는 프런트엔드 애플리케이션에 필요한 Python 종속성이 나열되어 있습니다. 이러한 종속성은 pip와 같은 패키지 관리자를 사용하여 설치할 수 있습니다.
docker-compose.yml
: Docker Compose용 구성 파일입니다. 애플리케이션 컨테이너에 대한 서비스, 네트워크 및 볼륨을 정의합니다. Docker Compose는 다중 컨테이너 애플리케이션 실행 프로세스를 단순화합니다.
README.md
: 일반적으로 프로젝트에 대한 문서가 포함된 Markdown 파일입니다. 여기에는 애플리케이션을 설정하고 실행하는 방법, 종속성 및 기타 관련 세부 정보가 포함됩니다.
notebook.ipynb
: 이 Jupyter 노트북 파일에는 Google Cloud의 Vertex AI를 사용하는 머신러닝 작업과 관련된 코드, 분석 또는 문서가 포함되어 있습니다.
이 프로젝트의 흐름은 데이터세트의 기본 구조를 이해하기 위한 탐색적 데이터 분석(EDA)부터 시작됩니다. 다음으로 왜곡 점수 엘보와 실루엣 점수를 기반으로 세그먼트 수를 결정합니다. 그런 다음 K-Means Clustering을 사용하여 모델을 훈련하고 예측합니다. 클러스터링 결과는 특정 특성을 지닌 5개의 고객 세그먼트를 보여줍니다. 그런 다음 Generative AI를 사용하여 각 고객 부문에 대한 마케팅 전략 단계를 결정합니다.
탐색적 데이터 분석(EDA)을 수행하고 지출 패턴, 주문 빈도, 반품 비율을 기준으로 고객을 5개 그룹으로 분류한 후 Generative AI를 사용하여 각 세그먼트에 맞는 맞춤형 마케팅 전략을 고안했습니다.
세그먼트 1: 중간 지출(52.75~112.75), 평균 $74.31, 1인당 평균 2.27건의 주문을 하는 고객입니다. 제안되는 마케팅 전략은 반복 구매를 장려하기 위해 개인화된 추천을 제공하는 것입니다.
세그먼트 2: 지출 금액이 더 높은 고객(112.75~233.00), 평균 $150.89, 1인당 평균 1.67 주문. 제안되는 마케팅 전략은 반복 구매에 대한 보상을 제공하는 로열티 프로그램을 도입하는 것입니다.
세그먼트 3: 지출이 많은 고객(558.75~999.00), 평균 $801.13, 1인당 평균 1.01 주문. 제안된 마케팅 전략은 프리미엄 쇼핑 경험을 향상시키기 위해 독점적인 고급 제품이나 서비스를 제공하는 것입니다.
세그먼트 4: 지출이 적은 고객(0.02~52.78), 평균 $31.24, 1인당 평균 1.85주문. 제안되는 마케팅 전략은 구독 서비스나 번들 거래를 도입하여 고객 유지율을 높이는 것입니다.
세그먼트 5: 상당한 지출(233.66~550.00), 평균 $314.91, 1인당 평균 1.44건의 주문을 하는 고객입니다. 제안되는 마케팅 전략은 고가치 고객을 인식하고 유지하기 위해 독점적인 VIP 이벤트 또는 경험을 만드는 것입니다.