데이터 분석

[TIL 32] 지표 정의와 시점에 대한 중요성

쭈경잉 2025. 8. 11. 23:48

지표는 계산식에 따라 의미가 다르고 용어로 표현하는 데에 있어 모두가 공통 기준으로 이해하지 못할 수 있다.

그러기에 공통 기준으로 정리, 어떤 수치를 가지고 어떤 수식으로 계산되었는 지 명확히 하는 게 중요하다.

 

주문 건수로 재구매율을 볼 수 있고 고객 기준으로 재구매율을 볼 수 있고

재구매 중에서 2, 3, 4회차 비율을 볼 수 있고 전체 고객 기준에서 2, 3, 4회차 비율을 볼 수 있다.

 

지표는 정의하고 해석하기 나름이기 때문에 명확히 공통 기준으로 정리하는 게 필요하다.

그래서 실무에서는 반드시 “지표 정의서(지표 사전)” 또는 “지표 명세서”를 만들어야 하고, 일관된 포맷으로 정리하는 것이 핵심⭐️

✅ 공통 기준으로 지표를 정리하는 3요소

구성 항목 설명 예시
정의 이 지표가 의미하는 바를 명확히 서술 “첫 구매 후 90일 내 재구매한 고객의 비율”
계산 방식 지표를 어떻게 계산하는지 수식으로 표현 재구매한 고객 수 / 첫 구매자 수
사용 데이터 및 조건 어떤 테이블·컬럼을 사용하고, 필터 조건은 무엇인지 user_id, purchase_date, purchase_nth, 90일 이내 구매 조건 등

✍️ 지표 정의 템플릿 예시

[지표명] : 90일 내 재구매율 (90D Repurchase Rate)

[지표 정의]
- 특정 고객이 자사몰에서 첫 구매 후 90일 이내에 2번째 구매를 한 비율

[지표 계산식]
- 재구매율 = 90일 내 2회 이상 구매한 고객 수 / 첫 구매 고객 수

[데이터 기준]
- 기준 기간: 분석 시작일 기준 n개월
- 제외 조건: 취소/미입금/NPAY 비회원 제외
- 사용 테이블: 주문 데이터 (order_data)
- 필요 컬럼: user_id, purchase_date, n_times, order_status
- 필터: purchase_nth = 1 기준으로 추출, 이후 90일 이내 재구매 여부 판단

[적용 예시]
- 2025.01~06월 기준 첫 구매자 2,000명 중 90일 내 600명 재구매 → 재구매율 30%

1. Notion/Excel에 지표 정의서 관리

  • 한눈에 검색 가능하게
  • 탭 구분: [공통 지표] / [캠페인 전용 지표] / [A/B 테스트 지표] 등

2. 대시보드에도 Tooltip 형태로 포함

  • Looker, DataStudio 등 지표 위에 마우스오버 시 정의/계산식이 보이도록

3. 모두가 참고하는 “지표 사전”으로 고도화

  • 유사 지표명 구분 (ex. 전환율 vs. 상세페이지 전환율 vs. 장바구니 전환율)
  • 용어 통일: 같은 의미인데 부서마다 다르게 부르면 안 됨

💡 지표 혼란 줄이는 팁

설명
용어에 단위 명시 “전환율(세션 기준)” vs “전환율(유저 기준)”
비율 vs 수치 구분 “재구매율”과 “재구매 건수”는 따로 구분
대상 명시 “신규 고객 전환율”인지, “전체 전환율”인지 항상 명시
동일 수식은 변수화 SQL, Excel에서도 동일 수식은 repurchase_flag, conversion_base처럼 컬럼화해 반복 정의 방지

 


데이터 분석에서 "시점"은 지표 해석, 분석 대상 정의, 액션 방향에 중요한 요소이다. 

"시점"에 대해서 명확화하는 것은 무엇보다 필요한 작업! 

 

✅ "시점"이 중요한 이유

중요성 설명
🎯 지표의 의미가 달라짐 같은 수치라도 기준 시점이 어디냐에 따라 완전히 다른 해석 가능
🧭 고객 여정에 맞는 분석 필요 유입 시점, 구매 시점, 행동 시점이 모두 다를 수 있음
🔄 시계열 변화 파악의 기준 시점 없이 트렌드 분석은 왜곡되기 쉬움
📆 정책/기획 효과 측정 기준 이벤트 적용 시점 기준으로 before/after를 명확히 나눠야 효과 측정 가능

🧠 분석에서 주로 구분해야 하는 시점 종류

시점명 설명 예시
유입 시점 고객이 사이트에 처음 들어온 시점 GA4의 first_visit_date
가입 시점 회원가입 시점 join_date, signup_date
첫 구매 시점 첫 주문이 발생한 시점 first_purchase_date
이벤트 발생 시점 광고 클릭/장바구니 추가 등 특정 행동이 일어난 시점 event_time, click_date
기준일 시점 분석을 위한 기준이 되는 시점 (컷오프 기준) “2024.07.01 기준으로 90일 이내 재구매율”
지표 측정 시점 지표를 어떤 날짜 기준으로 집계할지 “2025년 3월 LTV = 2024년 12월 가입자 기준”

📌 시점의 중요성이 드러나는 예시 - 재구매율 

❌ 예: “90일 내 재구매율” 분석 시 실수

  • 기준일 없이 그냥 1~3월 구매자 중 2번 이상 구매한 사람 비율로 집계
  • → 일부는 구매한 지 10일밖에 안 됐을 수도 있음 → 왜곡된 지표

✅ 올바른 방법

  • first_purchase_date 기준으로 90일 이후까지의 데이터 확보
  • first_purchase_date + 90일 이전까지 2번째 구매 여부 판단
  • → 시간 기준 정리로 정확한 재구매율 산출 가능

✍️ 시점 기준 정리 시 고려해야 할 요소

요소 질문 예시
분석 기준일은? "어떤 시점을 중심으로 데이터를 자를 것인가?"
시점 계산 방식은? "기준일 기준 ‘전후 90일’인가, ‘기간 내 행동’인가?"
대상이 되는 사람의 기준 시점은? "이 고객은 언제부터 우리가 측정 가능한 대상인가?"
분석 가능한 데이터 범위는? "시점 기준으로 충분한 데이터가 존재하는가?"

✅ 정리 팁: 시점 기준은 항상 명시적으로 표현하기 

예시 문장:

  • “2025년 3월 첫 구매 고객 기준으로, 90일 내 재구매율을 측정”
  • “유입일 기준이 아닌 구매일 기준으로 분석”
  • “각 고객의 첫 구매일 기준 180일 누적 LTV 계산”

👉 이렇게 명시해두면 커뮤니케이션/보고서/재현 모두 쉬워짐

 

재구매회차, 재구매율의 경우에도 "시점"에 대한 고려가 필수이다. 

재구매 회차처럼 “회차를 계산하는 지표”도 전체 기간 기준기간 제한 기준 두 가지로 나눠서 생각할 수 있다. 

📌 재구매 회차 계산 방식의 두 가지 시점 기준

1. 전체 기간 기준 회차

  • 고객의 모든 구매 이력을 기준으로 회차를 부여
  • 예: 2020년에 첫 구매하고 2025년에 재구매해도 2회차로 카운트
  • 장점: 고객의 평생(Lifetime) 구매 행동을 파악 가능
  • 단점: 오래된 구매 이력 때문에 최근 트렌드 파악이 어려울 수 있음

2. 기간 제한 기준 회차

  • 특정 기간 내 구매만을 기준으로 회차 부여
  • 예: 분석 대상 기간을 2024.01~2024.12로 한정 → 해당 기간 내 첫 구매 = 1회차, 두 번째 구매 = 2회차
  • 장점: 특정 캠페인, 시즌, 기획의 효과 분석에 유리
  • 단점: 기간 전의 구매 이력이 무시돼 회차 의미가 바뀔 수 있음

🧠 실무에서의 적용 예시

분석 목적 적합한 방식 이유
장기 고객 가치 분석 (LTV) 전체 기간 기준 고객의 전체 여정을 반영
특정 프로모션 효과 분석 기간 제한 기준 이벤트 시작 이후의 행동만 측정
신제품 출시 후 구매 패턴 분석 기간 제한 기준 출시일 이후 회차 기준으로 행동 변화 확인
충성 고객 정의 전체 기간 기준 누적 구매 횟수 기반 분류

✅ 로직 설계 시 체크포인트

  1. 회차의 의미를 정의
    • “고객의 평생 구매 순서”인지
    • “분석 대상 기간 내 구매 순서”인지
  2. 기간 전 구매 이력 처리 방법
    • 기간 전 이력을 회차 계산에 포함할지 제외할지
  3. 지표 보고 시 표현 방식
    • “n회차”라고만 쓰지 말고 기간 기준을 반드시 병기
    • 예: 2024년 기준 2회차 구매 고객 vs 전체 이력 기준 2회차 고객

분석을 할 때는 다방면의 요소를 고려해야 하는 만큼 주요 요소인 "시점"에 대한 부분도 인지해두기! 

 

✏️ 느꼈던 점 요약
- 데이터 분석을 하며 중요한 포인트인 "시점", 그에 따라 의미가 달라질 수 있다. 분석 시 고려해야 하는 요소로 체크해두기 

💪🏻 시도할 점
- 분석 case study 할 때 시점에 대한 부분 체크하며 아카이빙해두기, 사례 쌓기