데이터 분석

[TIL 12] 분석 2-1차 회고 : 분석 4 STEP 프로세스, 가설 언어화의 중요성

쭈경잉 2025. 6. 2. 08:18

지난 번 회고 때 지표 정의가 중요한 것과 동일한 맥락으로 

"가설 언어화" 즉 가설을 구체화하는 것의 중요성을 느껴 기록으로 남기고자 한다.

 

✔️ 이번 PBL 분석 건 - 신제품 출시 전략 유효성 검증

이번에 분석한 건은 "신제품을 출시하는 전략"이 재구매자의 리텐션 측면에서 유효했는가였다. 

이에 더불어 신규 고객까지 끌어오는 "확장 포트폴리오"의 개념이었는 지 확인하고자 했다. 

 

분석을 할 때 분석 방향성을 기획하는 업무를 진행하긴 했으나

방향성, 어떤 분석 방법 정도를 활용해야겠다~ 수준에 그쳤던 것 같다.

 

🥹 아쉬웠던 점

가장 아쉬웠던 점은 "지표 정의"와 "가설 구체화" 작업을 하지 못한 것에 있다.

그러다 보니 가장 핵심 지표였던 "재구매시 신제품으로 전환되는 비율"에 대해서 확인했어야 했는 데

그러지 못하고 유추하는 방법인 "제품 전체 구매자 수 대비 동일 제품 구매자수 비중"을 지표로 설정했다.

 

이 또한 틀린 방법은 아니나 "신제품의 재구매전환율"을 봤어야 명확한 인과관계로 설명할 수 있었을 것

 

☑️ 분석 과정 회고하기

  • 문제 정의와 지표 정의가 잘 되었을까?
    • 추출 및 분석을 하면서 지표가 뾰족해졌다. 초반에 분석 기획 및 설계를 할 당시에는 정확하지 못했다.
    • 예를 들어 제품 재구매자수는 동일 제품의 옵션까지 재구매한 사람일 수도 브랜드 상품을 재구매한 사람일 수도, 동일 제품을 재구매한 사람일 수도 있다. 정의 하기에 달려 있다.
    • 그래도 추출할 때 "동일 제품" 기준으로 봐야 그 의도를 반영할 수 있을 것이라는 부분에 따라 기준은 잘 잡았다. 

✏️ 지표를 고민할 때, 어떤 기준과 기간으로 볼 것인 지 정하는 게 중요하다. 

 

  • 분석 설계가 잘 되었을까?
    • 지표 정의 & 데이터에 대한 고민을 깊게 하지 못했던 것 같다. 
    • 분석 설계하는 건 결과를 예측하면서 그 지표를 뾰족하게 하는 데에 있다. 기준과 기간의 중요성을 고려해야 한다.

➡️ 앞으로 데이터 기준과 지표 정의는 회고 시 기록으로 남길 예정이다.

  • 활용한 데이터셋, 지표는 무엇일까?
    • 어떤 데이터를 활용하고 지표를 정의하는 지에 따라 분석의 결과가 달라질 수 있다. 
  • 앞으로 데이터 관리 용어 / 지표 등 정의를 해나가며 진행하는 것이 좋을 것으로 판단!
    • 데이터 / 지표 관리하는 노션 DB를 만들어 관리할 예정이다. 
    • 이후 분석 건들을 쌓아 단어 및 지표 가이드북화 할 수 있을 것으로 기대된다.

 

☑️ 신제품 출시 전략의 추가 분석해볼 만한 Point

  • 전환율 확인이 필요하다.
    • 기존 제품 구매자 중 몇 %가 신규 제품을 재구매했는지 (전환율) 지표도 병행하면 행동 기반의 인사이트 도출에 유의미할 것!
  • 월별 재구매자수 변화율도 추가로 확인해본다.
    • 출시월만이 아니라, 출시 이후 2~3개월 누적 재구매자 비중 변화도 포함하면 지속적 효과 파악 가능할 것 같다.

 

🥹 아쉽고 이후에 보완해야 할 점

1️⃣ 지표 정리가 모호했다. 이 부분이 가장 아쉽다. → 처음 기획할 때 사전적으로 진행되어야 하는 큰 부분이라는 생각이 든다. 

2️⃣ 해석이 어려운 용어의 사용 → 결론 분석 요약 내용 작성 시 “수치적”으로 비교해서 표현의 직관성을 높일 필요가 있다.

3️⃣ 추출 시간이 업무의 70% 비중을 차지해 비효율적이었다. → 이번에는 파악하느라 오래 걸렸지만 기획 단에서 더 깊게 고민을 가져가고 추출 리소스를 2~30%로 줄이는 게 좋을 듯 하다. 

4️⃣ 논리 흐름 구성과 단어의 적확한 표현 아쉬움 → 논리 흐름을 사실 / 판단 기준 / 판단 내용 순으로 정리하기 & 단어와 데이터, 지표 정의할 때 적확하게 정의하는 습관 들이기


📌 분석 프로세스 4 Step

STEP 1. [기획] 배경 파악 및 분석 방향성 잡기

- 문제 정의와 지표 정의

- 분석 대상 정의 / 분석 기간 설정

- 가설 언어화 및 구체화

- 비즈니스 목적과의 연결성 고려하기 (*이 분석 건은 왜 하는 지 목적 명확화)

- 기대 시나리오 정의 : 분석 전 예상되는 결과 정의 시 결과 해석과 분석 흐름 파악에 용이함 

 

STEP 2. [수집] 분석 데이터 추출 및 수집

- 필요 데이터셋 기획 및 리스트업, 데이터셋 구조 정리

- 데이터 추출

- 데이터 전처리 및 가공

- 데이터 품질 검증 : 결측/이상치 체크, 누락된 고객군 확인 

- 원천 기록 유지 및 문서화 : 전처리 스크립트 & 변경 이력 아카이빙하기

 

STEP 3. [분석] 가설 검증을 위한 EDA 및 시각화

- 데이터 분석

- 기초 통계, 검증 기법 체계화 : 검정 기법 선택 기준과 적용 아카이빙하기

- 결과 해석 템플릿화 : 수치, 해석, 비즈니스 제안 등 논리적 글쓰기 

- 고객 세그먼트/분류 포함 여부 체크 : 고객군 나눠 비교하거나 행동 패턴 분류 시 깊이 있는 인사이트 도출 가능 

 

STEP 4. [결과 정리] 분석 자료 작성

- 데이터 분석 내용 요약 내용 정리

- 인사이트 도출 & Action 아이템과 방향성 제안

- 인사이트 → ‘근거 + 맥락’으로 설명하기

- 액션 아이템 여러가지라면 '우선순위+실현 가능성' 기준으로 정리 제안하기

- 시각 자료 뷰티파이 & 강화 : 직관적으로 이해하기 쉽게 하기 

 

STEP 5. [회고] 분석 결과 정리 

- 분석 진행하며 아쉬웠던 부분/보완할 점 체크

- 활용 데이터셋/데이터 기준/지표 정의 회고


 

✅ 왜 가설 언어화가 중요한가?

분석 목적이 “막연한 탐색”이 아니라 “검증”이라면,
가설을 명확히 문장으로 적지 않으면 다음과 같은 문제가 생길 수 있다. 

  • 무엇을 비교해야 하는지 모호함
  • 어떤 지표가 핵심인지 불분명함
  • 결과 해석 시 해석 기준 없이 “좋다/나쁘다”로만 흐름

💬 가설 언어화 예시

아래는 실무 맥락에 맞춰 좋은 언어화 vs 나쁜 가설 예시를 정리한 표입니다:

구분나쁜 예 (모호한 가설)좋은 예 (언어화된 가설)

 

구분 나쁜 예(모호한 가설)  좋은 예(언어화된 가설) 
제품 신규 컬러 “신제품 옵션이 잘 팔릴까?” "기존 베스트셀러 신제품의 옵션은, 기존 옵션 대비 2주 이내 첫 구매 전환율이 높을 것이다."
세트 판매 vs 단품 판매 “세트가 더 잘 팔리는 것 같아.” "세트 구성(상의+하의)을 제공했을 때, 단품 대비 구매 전환율이 15%p 이상 높을 것이다."
상세페이지 구성 “상세페이지가 이탈을 줄일까?” "상세페이지 내 착용컷이 포함된 제품은, 포함되지 않은 제품 대비 장바구니 전환율이 유의하게 높을 것이다."
제품 재구매 패턴 “사람들이 재구매 많이 할까?” "상의 재구매 고객의 60% 이상은 동일 모델의 다른 컬러를 30일 이내에 구매할 것이다."
 

🧠 언어화의 구성 요소

가설을 언어화할 때는 아래의 4요소를 포함시키는 게 좋다.

구성 요소 설명 예시
조건(If) 어떤 상황에서 "신규 고객에게 세트 구성 추천 시"
대상/군 어떤 집단을 "30대 여성 고객 중 첫 구매자"
결과(Then) 어떤 변화가 일어날 것이다 "구매 전환율이 단품 대비 10%p 높을 것이다"
측정 지표 무엇으로 판단할 것인가 "7일 이내 전환율"
 

✨ 가설과 시나리오 작성하기 

  • 📌 가설: 세트 구성을 제공한 상세페이지는, 단품 페이지보다 장바구니 담기율이 더 높을 것이다
  • 🎯 비교 지표: - 장바구니 담기율 - 분석 기간: 2025.04.01~2025.05.15 - 고객군: 자사몰 첫 유입자 중 신규 고객
  • 시나리오 분기 작성
    • [시나리오 A] 가설이 맞음 → 세트 강조 구성 확대
    • [시나리오 B] 차이 없음 → 상의만 우선 노출 전략 유지
    • [시나리오 C] 오히려 단품이 더 좋음 → 세트 구성 개선 필요

✅ 가설 언어화의 장점

가설 언어화는 분석의 나침반 역할을 한다! 
말로 뭉뚱그려진 추측을, 구체적이고 검증 가능한 문장으로 정제하면:

  • 분석 설계가 쉬워지고
  • 팀 커뮤니케이션이 명확해지며
  • 결과 해석과 의사결정도 훨씬 수월해지는 장점이 있다. 

 

이번 기회에 가설 언어화, 분석 프로세스 4 STEP을 이해했고 다음 분석 시 적용해보고자 한다.

부족했던 부분들을 보완하고 절차를 아카이빙하면서 단계적으로 뽀개보려고 한다. 

 

✏️ 분석을 하면서 느꼈던 점 요약 
✅ 지표 정의, 가설 언어화의 중요성! 구체적이지 않으면 분석 방향이 흔들린다. 
✅ 가설을 구체화하고 시나리오를 작성하는 연습을 해야겠다고 느꼈다. 

 

💪🏻 Next to do 

☑️ 2차 분석 시 지표 정의, 가설 언어화를 통해 분석 설계 및 기획 단계를 촘촘히 하기

☑️ 시나리오 작성을 통해 분석 결과와 활용도에 대해 비즈니스 관점과 연결 짓기