데이터 분석 학습일지🐣
🅿️ Data Analysis Python Mini Project (7/12~25)
boiled egg
2023. 7. 27. 19:15
Sephora Online Data Analysis : 온라인 시장에서의 화장품 매출 증진을 위한 인사이트 발굴
Python Mini Project
Sephora Online Data Analysis: 온라인 시장에서의 화장품 매출 증진을 위한 인사이트 발굴
bb2-bb5.notion.site
🔻Click✔️
더보기
초안
- 베이스 데이터로 세울 수 있는 시나리오(가설)
- 시간대-상품 카테고리: 특정 시간대에 어떤 상품 카테고리가 인기가 있는지
- 평일 6-10시 시간대에는 어떤 상품 카테고리가 인기가 있을까?
- 성별-연령대: 특정 상품 카테고리를 성별과 연령대에 따라 분석 가능
- 유아용품은 어떤 성별과 연령대에서 인기가 있는지
- 패션 카테고리에서 어떤 성별과 연령대의 소비가 높은지
- 요일-평일/휴일: 특정 상품 카테고리가 요일 또는 평일/휴일에 따라 어떻게 변하는지
- 화장품은 주로 어떤 요일에 소비가 많은지
- 평일과 휴일에 어떤 상품 카테고리의 소비가 다른지
- 건수합계 비교: 각 상품 카테고리의 건수합계를 비교하여 가장 인기 있는 or 선호도가 낮은 상품 카테고리를 확인
- 가장 많은 건수합계를 가진 상품 카테고리
- 시간대별 성별 차이: 특정 시간대에서 남성과 여성의 소비 패턴이 다를지
- 6-10시 시간대에 남성과 여성의 구매량 차이
- 연령대별 상품 카테고리 선호도: 각 연령대에서 어떤 상품 카테고리가 인기 있는지
- 2O대와 60대이상에서 가전 제품에 대한 관심도의 차이
- 요일별 휴일/평일 소비 차이: 특정 요일에서 평일과 휴일의 소비 패턴이 다를 수 있음(가설)
- 토요일과 월요일에서 생활/사무용품 카테고리의 소비 차이는 있을까?
- 건수합계-상품 카테고리 유형: 어떤 상품 카테고리가 전체 건수합계에 더 큰 영향을 미치는지
- 생활/사무용품과 홈쇼핑 중에서 어떤 카테고리가 전체 건수합계에 더 많은 영향을 미치는지
- 시간대-상품 카테고리: 특정 시간대에 어떤 상품 카테고리가 인기가 있는지
- 각 가설들을 다른 데이터와 접목시켜 새로운 인사이트를 도출
- 시간대-상품 카테고리: 특정 시간대에 인기 있는 상품 카테고리는 무엇인가?
- 어떤 지역이나 계절에 따른 인기 상품을 파악하면 해당 상품을 관련 상품과 함께 판매함으로써 추가적인 수익을 올릴 수 있다.
- 요일-평일/휴일: 특정 상품 카테고리가 요일 또는 평일/휴일에 따라 어떻게 변하는가?
- 특정 요일이나 휴일에 해당 상품을 할인 판매함으로써 추가적인 수익을 올릴 수 있습니다.
- 요일별 휴일/평일 소비 차이: 특정 요일에서 평일과 휴일의 소비 패턴이 다를 수 있다. (가설)
- 해당 요일에 맞는 마케팅 전략을 세움으로써 추가적인 수익 기대
- 성별-연령대: 성별과 연령대에 따라 특정 상품 카테고리의 소비 패턴을 분석한다.
- 해당 성별과 연령대의 고객에게 해당 상품을 추천하는 마케팅 전략을 수립
- 시간대별 성별 차이: 특정 시간대에서 남성과 여성의 소비 패턴이 다른가?
- 해당 시간대에 남성과 여성에게 맞는 상품을 추천하는 마케팅 전략 수립
- 연령대별 상품 카테고리 선호도: 각 연령대에서 어떤 상품 카테고리가 인기 있는가?
- 해당 연령대의 고객에게 맞는 상품을 추천하는 마케팅 전략 수립
- 건수합계 비교: 각 상품 카테고리의 건수합계를 비교하여 가장 인기 있는 또는 선호도가 낮은 상품 카테고리를 파악한다.
- 건수합계-상품 카테고리 유형: 어떤 상품 카테고리가 전체 건수합계에 더 큰 영향을 미치는가?
- 건수합계-상품 카테고리 유형: 어떤 상품 카테고리가 전체 건수합계에 더 큰 영향을 미치는가?
- 해당 데이터를 바탕으로, 인기 상품을 재고로 유지하는 것이 경제적이고, 인기가 낮은 상품은 할인 판매함으로써 재고 줄이기 가능
- 시간대-상품 카테고리: 특정 시간대에 인기 있는 상품 카테고리는 무엇인가?
- 추가 수익을 올리는 방법
- Sephora Senario
- **인기도(loves_count)-평가(rating)**를 분석하여 고객들이 선호하는 제품을 파악
- 리뷰(reviews) 데이터 활용, 제품의 품질과 성능에 대한 피드백 (전처리 까다로울 듯)
- 가격(price_usd)-할인 가격(sale_price_usd), 제품의 가격 변동과 세일 이벤트에 대한 인사이트
- 혹은 너무 자주 or 너무 많이 세일하는 품목은 인기가 높아서일까? 없어서일까?
- limited_edition-sephora_exclusive 특별한 제품 전략?
- sephora_exclusive : 세포라에서만 구매할 수 있는 제품의 인기와 효과
- 제품의 주요 카테고리(primary_category)-세부 카테고리(secondary_category, tertiary_category) :정보를 분석하여 특정 제품 분야의 인기와 성장 가능성을 파악
진행 과정
- 주제 선정 - Sephora Online Data Analysis
- 분석 목표 및 인사이트 — 온라인 시장에서의 화장품 매출 증진을 위한 인사이트 발굴 —
- 데이터 수집 - kaggle (+googling)
-
- 데이터 전처리
- product_info dataset 1
- (skincare) reviews dataset 6 (0~250, 250~500, … , 1500)
- 6개 리뷰 데이터를 하나로 병합 후 구하고자 하는 기간 설정 (2022년 1월 ~ 2023년 3월) ⇒ 283,817 행, 18개 열
- 상품 데이터는 8,494행, 27열
- 상품+리뷰 데이터 병합(a+b)으로 새로운 merged_df 생성 (메인데이터)
- 사용하지 않을 컬럼 삭제 후 26개 열만 남김
- 결측치, 이상치 체크 (missingno 라이브러리 활용) ⇒ 삭제하기로 최종 결정
- 데이터 분석(과정)
- 취합 및 발표 자료 제작(ppt)
- 9조 파이썬 미니 프로젝트.pdf
- 최종 발표(7/26)