데이터 분석 학습일지🐣

🅿️ Data Analysis Python Mini Project (7/12~25)

boiled egg 2023. 7. 27. 19:15

Sephora Online Data Analysis : 온라인 시장에서의 화장품 매출 증진을 위한 인사이트 발굴

 

Python Mini Project

Sephora Online Data Analysis: 온라인 시장에서의 화장품 매출 증진을 위한 인사이트 발굴

bb2-bb5.notion.site

🔻Click✔️

더보기

초안

  • 베이스 데이터로 세울 수 있는 시나리오(가설)
    1. 시간대-상품 카테고리: 특정 시간대에 어떤 상품 카테고리가 인기가 있는지
      1. 평일 6-10시 시간대에는 어떤 상품 카테고리가 인기가 있을까?
    2. 성별-연령대: 특정 상품 카테고리를 성별과 연령대에 따라 분석 가능
      1. 유아용품은 어떤 성별과 연령대에서 인기가 있는지
      2. 패션 카테고리에서 어떤 성별과 연령대의 소비가 높은지
    3. 요일-평일/휴일: 특정 상품 카테고리가 요일 또는 평일/휴일에 따라 어떻게 변하는지
      1. 화장품은 주로 어떤 요일에 소비가 많은지
      2. 평일과 휴일에 어떤 상품 카테고리의 소비가 다른지
    4. 건수합계 비교: 각 상품 카테고리의 건수합계를 비교하여 가장 인기 있는 or 선호도가 낮은 상품 카테고리를 확인
      1. 가장 많은 건수합계를 가진 상품 카테고리
    5. 시간대별 성별 차이: 특정 시간대에서 남성과 여성의 소비 패턴이 다를지
      1. 6-10시 시간대에 남성과 여성의 구매량 차이
    6. 연령대별 상품 카테고리 선호도: 각 연령대에서 어떤 상품 카테고리가 인기 있는지
      1. 2O대와 60대이상에서 가전 제품에 대한 관심도의 차이
    7. 요일별 휴일/평일 소비 차이: 특정 요일에서 평일과 휴일의 소비 패턴이 다를 수 있음(가설)
      1. 토요일과 월요일에서 생활/사무용품 카테고리의 소비 차이는 있을까?
    8. 건수합계-상품 카테고리 유형: 어떤 상품 카테고리가 전체 건수합계에 더 큰 영향을 미치는지
      1. 생활/사무용품과 홈쇼핑 중에서 어떤 카테고리가 전체 건수합계에 더 많은 영향을 미치는지
  • 각 가설들을 다른 데이터와 접목시켜 새로운 인사이트를 도출
    1. 시간대-상품 카테고리: 특정 시간대에 인기 있는 상품 카테고리는 무엇인가?
      • 어떤 지역이나 계절에 따른 인기 상품을 파악하면 해당 상품을 관련 상품과 함께 판매함으로써 추가적인 수익을 올릴 수 있다.
    2. 요일-평일/휴일: 특정 상품 카테고리가 요일 또는 평일/휴일에 따라 어떻게 변하는가?
      • 특정 요일이나 휴일에 해당 상품을 할인 판매함으로써 추가적인 수익을 올릴 수 있습니다.
    3. 요일별 휴일/평일 소비 차이: 특정 요일에서 평일과 휴일의 소비 패턴이 다를 수 있다. (가설)
      • 해당 요일에 맞는 마케팅 전략을 세움으로써 추가적인 수익 기대
    마케팅 전략 수립
    1. 성별-연령대: 성별과 연령대에 따라 특정 상품 카테고리의 소비 패턴을 분석한다.
      • 해당 성별과 연령대의 고객에게 해당 상품을 추천하는 마케팅 전략을 수립
    2. 시간대별 성별 차이: 특정 시간대에서 남성과 여성의 소비 패턴이 다른가?
      • 해당 시간대에 남성과 여성에게 맞는 상품을 추천하는 마케팅 전략 수립
    3. 연령대별 상품 카테고리 선호도: 각 연령대에서 어떤 상품 카테고리가 인기 있는가?
      • 해당 연령대의 고객에게 맞는 상품을 추천하는 마케팅 전략 수립
    재고 파악 및 불필요한 지출 점검
    1. 건수합계 비교: 각 상품 카테고리의 건수합계를 비교하여 가장 인기 있는 또는 선호도가 낮은 상품 카테고리를 파악한다.
      • 건수합계-상품 카테고리 유형: 어떤 상품 카테고리가 전체 건수합계에 더 큰 영향을 미치는가?
    2. 건수합계-상품 카테고리 유형: 어떤 상품 카테고리가 전체 건수합계에 더 큰 영향을 미치는가?
      • 해당 데이터를 바탕으로, 인기 상품을 재고로 유지하는 것이 경제적이고, 인기가 낮은 상품은 할인 판매함으로써 재고 줄이기 가능
  • 추가 수익을 올리는 방법
  • Sephora Senario
    • **인기도(loves_count)-평가(rating)**를 분석하여 고객들이 선호하는 제품을 파악
    • 리뷰(reviews) 데이터 활용, 제품의 품질과 성능에 대한 피드백 (전처리 까다로울 듯)
    • 가격(price_usd)-할인 가격(sale_price_usd), 제품의 가격 변동과 세일 이벤트에 대한 인사이트
      • 혹은 너무 자주 or 너무 많이 세일하는 품목은 인기가 높아서일까? 없어서일까?
    • limited_edition-sephora_exclusive 특별한 제품 전략?
      • sephora_exclusive : 세포라에서만 구매할 수 있는 제품의 인기와 효과
    • 제품의 주요 카테고리(primary_category)-세부 카테고리(secondary_category, tertiary_category) :정보를 분석하여 특정 제품 분야의 인기와 성장 가능성을 파악

진행 과정

  1. 주제 선정 - Sephora Online Data Analysis
  2. 분석 목표 및 인사이트 — 온라인 시장에서의 화장품 매출 증진을 위한 인사이트 발굴 —
  3. 데이터 수집 - kaggle (+googling)
    1. 데이터 전처리
    2. product_info dataset 1
    3. (skincare) reviews dataset 6 (0~250, 250~500, … , 1500)
      1. 6개 리뷰 데이터를 하나로 병합 후 구하고자 하는 기간 설정 (2022년 1월 ~ 2023년 3월) ⇒ 283,817 행, 18개 열
      2. 상품 데이터는 8,494행, 27열
    4. 상품+리뷰 데이터 병합(a+b)으로 새로운 merged_df 생성 (메인데이터)
    5. 사용하지 않을 컬럼 삭제 후 26개 열만 남김
    6. 결측치, 이상치 체크 (missingno 라이브러리 활용) ⇒ 삭제하기로 최종 결정
  1. 데이터 분석(과정)
  2. 취합 및 발표 자료 제작(ppt)
  3. 9조 파이썬 미니 프로젝트.pdf
  4. 최종 발표(7/26)

발표 자료

✅click [슬라이드 정리]