데이터 분석

[TIL 19] 데이터 분석에서의 "집합" 개념 적용의 필요성, 이해를 돕는 데 유리하다.

쭈경잉 2025. 6. 25. 23:19

보통 요즘의 내가 분석하는 것은 "고객" 데이터 분석인 경우가 많아

특히 "집합" 개념을 활용하는 게 이해도를 더 높이는 것 같다고 느꼈다.

 

데이터를 설명할 때, MECE하게 설명할 때에도 이 집합 개념은 유용하다.

고객 세그먼트를 이해할 때, 필요하다고 느꼈으며 교차 구매율을 구할 때 활용하니 이해가 편했다.

 

집합 개념은 흔히 “고객 단위 분석”에서 활용도가 높지만, 실제로는 고객 외 다양한 분석 단위에 적용될 수 있다.

집합의 핵심은 “어떤 개체를 기준으로 교집합·차집합·여집합처럼 비교할 수 있는가”가 포인트이다.

 

“집합(Set)” 개념은 고객군을 구분하고 교차하는 분석에서 유용하고 이커머스 실무에서도 효과적인 데이터 분석 도구로 쓰일 수 있다. 

특히 고객 세그먼트, 재구매 분석, 제품 교차 구매 분석 등에 강력하게 활용된다.


집합 개념으로 하면 좋은 이커머스 분석 CASE 4가지

1. 신규 vs 재구매 vs 휴면 고객 세분화

  • 개념: 전체 구매자 집합을 세 집합으로 나눔
    • 신규 구매자 AAA
    • 재구매자 BBB
    • 일정 기간 미구매자 CCC
  • 활용: 고객 상태별로 리텐션 전략, 프로모션 대상 구분 가능

2. 제품 간 교차 구매 분석

  • 예시: 반팔티를 구매한 고객 중 반바지도 함께 구매한 비율은?
  • 표현:
    • 반팔티 구매자 AAA, 반바지 구매자 BBB
    • A∩B : 반팔티 & 반바지 둘 다 구매한 고객
  • 활용: 세트 구성 추천, 상세페이지 연관 제품 제안에 활용 가능

3. 카테고리별 구매 집합 비교

  • 예시: 상의 구매자와 하의 구매자의 교집합 비율
  • 표현:
    • AAA: 상의 구매자
    • BBB: 하의 구매자
    • A∖B : 상의만 산 사람
    • A∩B : 둘 다 산 사람
  • 활용: 카테고리 간 크로스셀 전략 수립 근거 확보

4. 회원 vs 비회원 구매자 분석

  • 표현:
    • MMM: 회원 구매자
    • GGG: 비회원 구매자
    • M∩G=∅ → disjoint set (완전히 구분된 집합)
  • 활용: 회원화 전략 설계, 회원 대상 CRM 캠페인 최적화

✏️ 집합 개념이 유용한 이유

장점 설명
🎯 세그먼트 명확화 겹치는 대상, 겹치지 않는 대상 구분이 논리적으로 깔끔함
📊 시각화 용이 벤 다이어그램 / 분할표 등으로 이해하기 쉬움
✅ 조건 필터링 용이 SQL / BQ 분석 시 조건절로 구현하기 쉬움
🧩 액션 연결 용이 각각의 교집합/차집합별로 다른 마케팅 액션 설계 가능

 

➡️ 집합 개념은 “고객군을 논리적으로 정의하고 비교하는 사고 도구”가 될 수 있음을 기억하자

 

✅ 고객이 아닌 경우에 집합 개념을 활용할 수 있는 분석 케이스

참고 : \cap > 교집합, \setminus > 차집합 

➡️ 상품, 채널, 시간, 구매 행위 등 "비교"가 주요 포인트가 될 때 집합 개념을 활용하면 좋다. 


1. 상품(Product) 단위의 집합 분석

💡 예시: 동일 시즌 내 ‘교차 구매된 상품’ 파악

  • AAA: 5월에 구매된 브라
  • BBB: 5월에 함께 구매된 팬티
  • A∩BA \cap BA∩B: 함께 장바구니/주문된 세트 제품군

👉 세트 기획, 페이지 연관 상품 추천, 번들 구성 전략에 유용

 

💡 예시: 세일/비세일 상품군 비교

  • SSS: 세일 적용된 상품
  • NNN: 비세일 상품
  • S∩NS \cap NS∩N: 세일과 비세일을 동시에 구매한 상품 → 교차 전략 가능

2. 채널(Channel) 단위 집합

💡 예시: 동일 고객의 채널별 유입 기록

  • III: 인스타그램 유입자
  • KKK: 카카오 광고 유입자
  • I∩KI \cap KI∩K: 두 채널 모두 거친 멀티채널 유입자

👉 멀티채널 캠페인 ROI 비교, 채널간 시너지 분석

 

💡 예시: 각 채널에서 많이 팔린 상품 집합 비교

  • AAA: 인스타그램 상위 판매 상품
  • BBB: 검색 광고 상위 판매 상품

👉 채널별 제품 매칭 전략 수립


3. 시간(Time) 단위 집합

💡 예시: 특정 달 vs 전월 판매 상품 비교

  • M4M_4M4: 4월에 팔린 상품
  • M5M_5M5: 5월에 팔린 상품
  • M4∖M5M_4 \setminus M_5M4∖M5: 5월에 안 팔린 4월 인기 상품 → 이탈 이슈 점검 가능

👉 재고 회전율 분석, 시즌성 상품 감지


4. 구매 행위(Action) 단위 집합

💡 예시: 장바구니 vs 찜 vs 구매 집합 비교

  • CCC: 장바구니 담은 사람
  • FFF: 찜(관심상품) 등록한 사람
  • PPP: 실제 구매한 사람
  • (C∩P),(F∩P),(C∩F∖P)(C \cap P), (F \cap P), (C \cap F \setminus P)(C∩P),(F∩P),(C∩F∖P) 등

👉 전환 퍼널 병목 지점 파악, 행동 기반 리타게팅 타겟 식별


✅  요약 : 집합 분석 기준은 ‘고객’이 아니어도 충분히 확장 가능하다.

분석 단위 집합 예시 분석 목적

분석 단위 집합 예시 분석 목적
고객 신규 vs 재구매, 리뷰자 vs 미작성자 세그먼트 타기팅
상품 교차 구매, 채널별 인기 상품 기획/번들 전략
채널 멀티 유입자, 채널간 고객 겹침 마케팅 믹스 최적화
시간 시점별 구매 변화 시즌성/트렌드 추이
행동 장바구니 vs 찜 vs 구매 전환 유도 포인트 찾기

👉 앞으로 집합 개념을 확장해서 적용해볼 수 있도록 해야겠다. 이해도를 높이기 위해 전체의 관점에서 집합 개념 확장 활용해보기

 

✏️ 느꼈던 점 요약
- 데이터를 보다 잘 이해하기 위해서는 "집합" 개념을 활용해보는 것도 좋다. 더 집단과 분석 대상에 대한 이해도가 높아진다. 

💪🏻 시도할 점
- 각 분석 케이스, 분석 항목과 기준에 따라 집합 개념 적용해보기