데이터 분석

[TIL 7] 1-1차 분석. 고객 현황 파악을 위한 신규/재구매자 분석

쭈경잉 2025. 5. 6. 15:19

지난 시간에 이어 고객 현황 파악을 위한 데이터 분석이 선행되어야 하여

1-1차 분석으로 분류했고 이에 따라 신규 구매자수 / 재구매자수 추출을 통해 분석을 진행해보고자 한다.

 

현업 데이터를 활용하며 PBL 프로젝트를 진행하는 것이므로 데이터에 대한 오픈은 어렵지만

그에 따른 단계는 기록하고 분석을 하면서 생기는 궁금증과 배운점은 기록으로 남기고자 한다.

 

☑️ 나의 목표 : 단계에 대한 흐름 이해와 사고 흐름의 과정 위주로 아카이빙해두기!

 

1️⃣ 신규/재구매 고객 현황 파악

신규, 재구매 고객 현황 파악을 위해서는 크게 데이터 분석 프로세스를 따르되 필요한 데이터셋과

확인해야 하는 포인트를 체크해가며 세부적인 분석을 진행했다. 

➡️ 데이터 분석 프로세스 
[STEP 1: EDA] → [STEP 2: 문제 정의] → [STEP 3: 정량 분석] → [STEP 4: 인사이트 도출 및 전략 아이디어 기획]

➡️ 필요한 데이터셋 : 최근 3년간의 월별 신규 구매자수, 재구매자수, 전체 구매자수 

➡️ 확인할 점 : 시즌성 흐름과 등락 추이를 통해 특이점 발견하기 
- 신규 고객 수 추이 
- 재구매 고객 수 추이 
- 신규 고객과 재구매 고객 비중 추이
- 계절성/이상치 확인(*분기별, 특정 월에 급증 급감 구간 알아보기) 

 

[Step 1: EDA] 흐름 탐색 (무엇이 보이는가?)

관찰 대상 EDA 분석 내용 시각화 예시
신규 고객 추이 - 월별 신규 고객 시계열 확인
- 프로모션/비수기와 비교
Line chart (월별 신규 고객 수)
재구매 고객 추이 - 동일하게 시계열 흐름 확인
- 신규와 함께 겹쳐서 비교
Line chart (신규 vs 재구매)
비중 변화 - 신규/재구매 고객 비중 변화 확인 Stacked Bar or Area chart
계절성/이상치 - 분기별 반복되는 패턴이 있는가?
- 특정 월에 급증/급감하는 구간은?
Boxplot or Seasonality line
 

🔍 EDA 관찰 Point 신규고객 vs 재구매 고객의 성장률과 추이 확인을 통한 현황 파악 

  • Line chart를 확인하며 신규 고객 / 재구매 고객이 급증하는 구간 살피기
  • 재구매자 수치가 신규 구매자 수치를 넘기는 구간 살피디
  • Stacked Bar 혹은 Area chart 를 통해 비중에 대한 추이 & 누적 수치 파악하기
  • 월별 등락 추이를 통한 시즈널 리티 이슈 확인하기

1. 월별 신규/재구매 고객  시계열 흐름 확인하기

  • 무엇을 볼까?
    • 월별 첫구매자수, 재구매자수 절대 수치 흐름
    • 신규 대비 재구매 전환이 증가/감소하는지 
  • 어떻게? (시각화)
    • Line chart (2 라인: 첫구매자수, 재구매자수)
    • 월별 trend 확인 → 상승/하락 구간, 교차 시점 주목

여기서 확인할 점은 연도별 / 분기별로 끊어서 볼 때 어떤 등락 추이를 보는 지 체크했다.

 

2. 전체 구매자   구성 비중 추이 파악

  • 무엇을 볼까?
    • 전체 구매자수 = 첫구매자수 + 재구매자수
    • 전체  신규/재구매 고객의 비중 변화
       유입 중심 브랜드인지, 리텐션 중심 브랜드인지 판단
  • 어떻게? (시각화)
    • Stacked Area chart: 전체 구매자  신규/재구매 비중
    • 신규 비중이 줄어드는 구간 = 문제 시그널 구간

 

비중을 확인해 전략에 따라 어디에 집중해야 할 지를 보여주는 분석!

재구매자수가 탄탄하다면 장기적인 매출 파이 확장을 위해 "신규 구매"에 집중하는 것이 맞을 수 있겠다는 생각이 들었다.


3. 성장률 변화 확인 (MoM)

  • 무엇을 볼까?
    •  월의 고객 수가 전월 대비 얼마나 증가/감소했는지
    • 신규 고객 유입 흐름이 안정적인가? 변동성이 큰가?
  • 어떻게? (시각화)
    • Bar chart: MoM 성장률
    • Line chart: 누적 고객  기준 상승/하락 구간 추이

4. 시즌성/계절성 확인

  • 무엇을 볼까?
    • 매년 같은 시점에 반복되는 상승/하락 구간 있는가?
    • 분기 및 시즌에 따른 상승 / 하락 구간을 확인하기 
  • 어떻게? (시각화)
    • Boxplot: 월별 분포 비교 (21~25 1월끼리 비교 등)
    • Heatmap: 연도 vs  매트릭스로 패턴 비교

5. 주요 시점 체크 및 보완

분석 흐름을 보면서 다음과 같은 포인트를 체크하면 된다.

전반적인 체크와 시즈널리티를 확인해보면 되고 그 달의 광고비를 보완적으로 보면 좋을 것 같다.

관찰 포인트 해석 예시
신규/재구매 고객 수가 교차하는 시점 구조 전환 발생: 재구매 비중이  커진 순간
신규 고객 수가 급감한  마케팅 공백 / 제품 이슈 / 채널 문제 가능성
특정 시즌에만 신규 고객 급증 시즌 한정 제품 or 광고 집중 시기 가능성
 
3~5번의 경우, 정량 분석과 지표를 함께 유기적으로 보는 것이 좋겠다 생각해서
함께 진행했고 그에 따라서 CAGR 지표도 함께 보기로 했다.
 
광고 집중 / 마케팅의 시즌성은 추가 확인이 필요했기에 별도로 보완적으로 확인해보기로 했다.

 

📌 시각화를 통한 분석이 필요한 부분
1. 신규 vs 재구매 고객 추이 Line Chart
2. 전체 고객 중 비중 Stacked Area Chart
3. MoM 성장률 비교 Bar Chart

 

신규/재구매 현황 파악 CASE 의 경우, EDA를 통해 전반적인 수치 확인과 인사이트 도출이 가능했다.

분석의 목적 자체가 "특이성 발견", "추이를 통한 파악"이었기 때문인 것 같다.

[Step 2: 문제 정의] 분석 목적 명확화

이전 글에서 문제 정의로 잡은 부분 / 제품 기획 파트에서 문제로 잡고 있는 부분이 수치적으로 맞는 지 확인해본다. 

  • 신규 고객 유입이 줄고 있다는 가설은 정량적으로 맞는가?
  • 브랜드는 지금 충성고객 중심 구조바뀌고 있는가?”
  • “제품 전략은 리텐션 기반 확장보다 신규 유입에 집중해야 하는가?”

질문에 답하려면 수치 기반의 구조적 검증필요하여 EDA와 지표로 구조화하는 작업 후 인사이트 도출해야 한다.


[Step 3: 정량 분석] 지표로 구조화

분석 지표 정의  해석 포인트
신규 고객 월별 최초 구매 고객 증가/감소 여부, CAGR
재구매 고객 월별 2이상 구매 고객 반복성 구조 존재 여부
전체 고객 월별 전체 구매 고객 전반적 성장 파악
신규 고객 비중 신규 고객 수 / 전체 고객 유입 위주 vs 유지 위주 구조
재구매 고객 비중 재구매 고객 수 / 전체 고객 충성도 구조 형성 여부
성장률 (MoM, YoY) 지표의 전월/전년대비 성장률 시기별 반등/하락 구간 찾기
CAGR 시작~종료 시점의 연평균 성장률 장기 성장 속도 추정
 

🔍 정량 분석 인사이트

  • 최근 1년간 신규 고객 수와 재구매 고객수의 YoY, QoQ 기준 성장률 확인 실제 성장률 추이 확인하기 위함
  • 단, 프로모션 및 광고의 영향도가 연도별/분기별로 다를 수 있기에 CAGR 개념을 활용해 연평균 성장률과 대조하여 본다.
  • 신규 고객 비중의 감소 추이 & 재구매 고객 비중의 등락 추이 비교하여 브랜드가 재구매/신규구매 구조에서 어디에 집중해야 하는 지 보여준다.
  • 추가 분석 Point : 재구매율 수치와 구매 회차별 비중, 1회차 평균 객단가 / 2회차 평균 객단가를 대조해보면 좋을 듯 하다.

 

✅ 수치를 통해 [구매 > 재구매 > 매출 확장 구조라는 것이 검증]된다면

신규 고객을 추가 확보하는 전략 방향성이 효율 높을 것으로 판단할 수 있다.

 

📝 CAGR 이 왜 필요할까? 언제 활용하면 좋을까?
활용 목적 설명
고객 기반의 장기 추이 확인 단순 MoM 증감률보다 본질적인 성장성 파악
신규 vs 재구매 전략적 우선순위 결정 어떤 고객군이 브랜드 성장을 견인했는지
제품군별 고객 성장 비교 쿨핏 제품 구매자 vs 볼륨핏 구매자 그룹

✏️ CAGR 정의
CAGR
일정 기간 동안의 연평균 성장률을 말하며,
시작값과 마지막 값을 기준으로 복리로 환산한 평균 성장률

 

✏️ CAGR 공식
CAGR은 일정 기간 동안의 연평균 성장률을 말하며,
시작값과 마지막 값을 기준으로 복리로 환산한 평균 성장률

  • Start Value: 시작 시점 고객 수 (예: 20231신규 고객 수)
  • End Value: 종료 시점 고객 수 (예: 20253신규 고객 수)
  • n: 기간 (단위. 단위로 계산 개월 수 ÷ 12)

✅ 유의점 Point : 월별로 보는 것이 아닌 연도로 보는 것이 필요하다. 시작 시점 고객 수 월별이 아닌 23년 / 24년 데이터 합으로 비교해서 봐야한다. 그래야 월별 극단값이 아닌 연도별 값을 볼 수 있다. 


💡 Step 4: 인사이트 & 전략 연결

발견한 사실  전략적 시사점 
신규 고객 비중이 줄고 있을 경우 이후 기획 시 첫구매 유도 제품군(진입장벽 낮은 제품) 확보 필요
재구매 고객 기반이 성장 중일 경우 충성 고객 세그먼트 맞춤형 확장 제품 우선순위 상향 필요
시즌성 영향 명확할 경우 제품 출시/캠페인 타이밍은 2분기와 3분기에 집중하기

EDA를 통해 전반적인 확인을 해가며 "지표"를 통해 이해해보고자 했다.

확실히 시각화를 통해 등락 추이 확인 / 누적 차트 / stacked Bar 등 여러 방면에서 보니 다르게 보였다.

 

💪🏻 Next to do 

☑️ 재구매 회차별 월별 비중 추이, 신규 구매 객단가 vs 재구매 객단가 비교를 통한 보완

☑️ 고객 LTV 분석을 통한 첫구매 고객 유치의 중요성 파악 

 

✏️ 1-1차 고객 현황 파악하기 분석을 하며 느낀 점
✅ "어떻게 볼 것인가" "무엇을 볼 것인가" 의 중요함을 느끼게 된 첫번째 Case 분석
✅ 각 단계는 유기적으로 연결되어 있을 수 있다. 분석으로 무엇을 확인할 지 정하고 기획을 선행하고 단계별로 확인할 포인트를 예측해보자. 어떤 수치를 그릴 것이다!라고 가설을 세우고 파악하는 게 방향성을 잘 잡아 갈 수 있는 방법