보통 요즘의 내가 분석하는 것은 "고객" 데이터 분석인 경우가 많아
특히 "집합" 개념을 활용하는 게 이해도를 더 높이는 것 같다고 느꼈다.
데이터를 설명할 때, MECE하게 설명할 때에도 이 집합 개념은 유용하다.
고객 세그먼트를 이해할 때, 필요하다고 느꼈으며 교차 구매율을 구할 때 활용하니 이해가 편했다.
집합 개념은 흔히 “고객 단위 분석”에서 활용도가 높지만, 실제로는 고객 외 다양한 분석 단위에 적용될 수 있다.
집합의 핵심은 “어떤 개체를 기준으로 교집합·차집합·여집합처럼 비교할 수 있는가”가 포인트이다.
“집합(Set)” 개념은 고객군을 구분하고 교차하는 분석에서 유용하고 이커머스 실무에서도 효과적인 데이터 분석 도구로 쓰일 수 있다.
특히 고객 세그먼트, 재구매 분석, 제품 교차 구매 분석 등에 강력하게 활용된다.
✅ 집합 개념으로 하면 좋은 이커머스 분석 CASE 4가지
1. 신규 vs 재구매 vs 휴면 고객 세분화
- 개념: 전체 구매자 집합을 세 집합으로 나눔
- 신규 구매자 AAA
- 재구매자 BBB
- 일정 기간 미구매자 CCC
- 활용: 고객 상태별로 리텐션 전략, 프로모션 대상 구분 가능
2. 제품 간 교차 구매 분석
- 예시: 반팔티를 구매한 고객 중 반바지도 함께 구매한 비율은?
- 표현:
- 반팔티 구매자 AAA, 반바지 구매자 BBB
- A∩B : 반팔티 & 반바지 둘 다 구매한 고객
- 활용: 세트 구성 추천, 상세페이지 연관 제품 제안에 활용 가능
3. 카테고리별 구매 집합 비교
- 예시: 상의 구매자와 하의 구매자의 교집합 비율
- 표현:
- AAA: 상의 구매자
- BBB: 하의 구매자
- A∖B : 상의만 산 사람
- A∩B : 둘 다 산 사람
- 활용: 카테고리 간 크로스셀 전략 수립 근거 확보
4. 회원 vs 비회원 구매자 분석
- 표현:
- MMM: 회원 구매자
- GGG: 비회원 구매자
- M∩G=∅ → disjoint set (완전히 구분된 집합)
- 활용: 회원화 전략 설계, 회원 대상 CRM 캠페인 최적화
✏️ 집합 개념이 유용한 이유
| 장점 | 설명 |
| 🎯 세그먼트 명확화 | 겹치는 대상, 겹치지 않는 대상 구분이 논리적으로 깔끔함 |
| 📊 시각화 용이 | 벤 다이어그램 / 분할표 등으로 이해하기 쉬움 |
| ✅ 조건 필터링 용이 | SQL / BQ 분석 시 조건절로 구현하기 쉬움 |
| 🧩 액션 연결 용이 | 각각의 교집합/차집합별로 다른 마케팅 액션 설계 가능 |
➡️ 집합 개념은 “고객군을 논리적으로 정의하고 비교하는 사고 도구”가 될 수 있음을 기억하자
✅ 고객이 아닌 경우에 집합 개념을 활용할 수 있는 분석 케이스
참고 : \cap > 교집합, \setminus > 차집합
➡️ 상품, 채널, 시간, 구매 행위 등 "비교"가 주요 포인트가 될 때 집합 개념을 활용하면 좋다.
1. 상품(Product) 단위의 집합 분석
💡 예시: 동일 시즌 내 ‘교차 구매된 상품’ 파악
- AAA: 5월에 구매된 브라
- BBB: 5월에 함께 구매된 팬티
- A∩BA \cap BA∩B: 함께 장바구니/주문된 세트 제품군
👉 세트 기획, 페이지 연관 상품 추천, 번들 구성 전략에 유용
💡 예시: 세일/비세일 상품군 비교
- SSS: 세일 적용된 상품
- NNN: 비세일 상품
- S∩NS \cap NS∩N: 세일과 비세일을 동시에 구매한 상품 → 교차 전략 가능
2. 채널(Channel) 단위 집합
💡 예시: 동일 고객의 채널별 유입 기록
- III: 인스타그램 유입자
- KKK: 카카오 광고 유입자
- I∩KI \cap KI∩K: 두 채널 모두 거친 멀티채널 유입자
👉 멀티채널 캠페인 ROI 비교, 채널간 시너지 분석
💡 예시: 각 채널에서 많이 팔린 상품 집합 비교
- AAA: 인스타그램 상위 판매 상품
- BBB: 검색 광고 상위 판매 상품
👉 채널별 제품 매칭 전략 수립
3. 시간(Time) 단위 집합
💡 예시: 특정 달 vs 전월 판매 상품 비교
- M4M_4M4: 4월에 팔린 상품
- M5M_5M5: 5월에 팔린 상품
- M4∖M5M_4 \setminus M_5M4∖M5: 5월에 안 팔린 4월 인기 상품 → 이탈 이슈 점검 가능
👉 재고 회전율 분석, 시즌성 상품 감지
4. 구매 행위(Action) 단위 집합
💡 예시: 장바구니 vs 찜 vs 구매 집합 비교
- CCC: 장바구니 담은 사람
- FFF: 찜(관심상품) 등록한 사람
- PPP: 실제 구매한 사람
- (C∩P),(F∩P),(C∩F∖P)(C \cap P), (F \cap P), (C \cap F \setminus P)(C∩P),(F∩P),(C∩F∖P) 등
👉 전환 퍼널 병목 지점 파악, 행동 기반 리타게팅 타겟 식별
✅ 요약 : 집합 분석 기준은 ‘고객’이 아니어도 충분히 확장 가능하다.
분석 단위 집합 예시 분석 목적
| 분석 단위 | 집합 예시 | 분석 목적 |
| 고객 | 신규 vs 재구매, 리뷰자 vs 미작성자 | 세그먼트 타기팅 |
| 상품 | 교차 구매, 채널별 인기 상품 | 기획/번들 전략 |
| 채널 | 멀티 유입자, 채널간 고객 겹침 | 마케팅 믹스 최적화 |
| 시간 | 시점별 구매 변화 | 시즌성/트렌드 추이 |
| 행동 | 장바구니 vs 찜 vs 구매 | 전환 유도 포인트 찾기 |
👉 앞으로 집합 개념을 확장해서 적용해볼 수 있도록 해야겠다. 이해도를 높이기 위해 전체의 관점에서 집합 개념 확장 활용해보기
✏️ 느꼈던 점 요약
- 데이터를 보다 잘 이해하기 위해서는 "집합" 개념을 활용해보는 것도 좋다. 더 집단과 분석 대상에 대한 이해도가 높아진다.
💪🏻 시도할 점
- 각 분석 케이스, 분석 항목과 기준에 따라 집합 개념 적용해보기
'데이터 분석' 카테고리의 다른 글
| [TIL 21] 비율 지표에 있어 분자, 분모 해석 방법과 분석에 적절한 지표 개수는? (0) | 2025.06.29 |
|---|---|
| [TIL 20] 데이터 리터러시 향상을 위한 통계, 수학 개념 이해의 중요성 (1) | 2025.06.26 |
| [TIL 18] 데이터 리터러시의 중요성, 꾸준함으로 역량을 쌓아야겠다. (6) | 2025.06.24 |
| [TIL 17] 데이터 분석에서의 통계 필요성? 차근히 공부하기로 다짐했다. (0) | 2025.06.20 |
| [TIL 16] 지표와 데이터 정리의 필요성과 중요성(w. 지표 - 분모, 케이스 비교) (0) | 2025.06.18 |