데이터 분석

[TIL 2] 실무형 데이터 분석 프로젝트를 위한 단계별 로드맵

쭈경잉 2025. 5. 1. 15:56

지난 번에 쓴 PBL 데이터 분석 공부법을 큰 방향으로 잡고

실제 실무형 데이터 분석 프로젝트를 진행하기 위해 단계별 로드맵을 세워 보았다.

 

✅ 과거 나의 아쉬웠던 점

이전에 시도를 해보고자 했을 땐 현실적으로 직장을 다니면서 시간의 한계성이 참 아쉬웠다.

프로젝트를 진행해도 뚝뚝 끊기는 듯한 느낌을 받았고 그러다 보니 지속하기 어려움이 있었다.

 

✅ 보완 및 시도해 볼 부분

따라서 이번에는 데이터 분석 프로세스를 기획하는 데에 힘을 쏟으며 단계별 로드맵을 그리고자 했다.

작은 것부터 단계별로 쪼개서 주중 3일 하루 1시간 / 주말 중 1일 하루 2~3시간 투자하기로!

 

이전 [TIL 1] 한달 데이터 분석 공부, 어떤 방법으로 하는 것이 효율적인가? 글에서 방향성에 맞추려 한다.

STEP 3: 중간 규모 데이터 분석 프로젝트에 따라 실무형 데이터 분석 프로세스 세분화를 통해 단계별 로드맵, TO DO를 그린다.

 

☑️ 기본적인 큰 방향성 : "데이터 구조 파악 → 데이터 수집 → 전처리 → 분석 → 인사이트 도출 → 개선 아이디어 정리"

 

이 구조는 유지하되 세분화 ver 을 통해 그려본 단계별 로드맵은 아래와 같다.

비즈니스 이해 → 데이터 구조 파악 

질문 정의 → 데이터 수집 및 추출

전처리/가공 → EDA/시각화

인사이트 도출 → 아이디어 제시

 

✅ 포인트 : 비즈니스 이해~전처리 과정이 80% 라고 생각한다. 실제로 교육업계 PM으로 일을 하며 약 200명 넘는 데이터 분석가들을 만나오면서 공통적으로 해왔던 말이다. 그 과정이 잘되면 인사이트는 자연스럽게 나오는 것

 

특히 요즘 직접 분석을 하며 느끼는 건 비즈니스를 이해하는 사전 밑거름 작업은 필수, 질문을 잘 던지는 것이 가장 중요하다.

여기에 60~70% 투자해야 한다. 첫 단추를 잘 끼우는 셈이다.

 

이 첫 방향을 잘 기획하지 못하면 마치 원래는 부산을 가자고 했지만 경춘선을 타는 셈이 되어버린다. 

공부 방법을 "PBL"로 잡은 이후도 이 헤매는 과정을 겪고 기획을 잘하기 위함이었다. 

 

"왜" 해야 하는 지에 대한 고민을 해보는 시간을 만드는 것, 어떤 방법이 그 문제를 해결할 수 있을 지

문제 - 원인 분석 - 가설 - 해결 의 시나리오로의 "문제 정의 프레임워크"를 활용해보고자 한다. 

 

실무형 데이터 분석 프로세스 단계별 로드맵

1. 데이터 구조 파악
📝 목적 : 비즈니스에 대한 이해도 향상 / 사전 작업 
  • 비즈니스 모델 이해
    → 이 데이터는 어떤 목적을 위해 존재하는가? (ex: 구매 데이터 = 매출 발생 구조 이해)
  • 데이터 모델/스키마 파악
    → 테이블 구조, 컬럼 설명, 키 관계 파악 (Primary Key, Foreign Key 등)
  • 데이터 규모 및 특징 파악
    → 데이터 건수, 날짜 범위, 이상치, 결측치 분포 등 체크

Check: "내가 어떤 데이터를 다루는지 완전히 이해했는가?"

 

가장 기본이 되는 것은 비즈니스를 이해하기 위한 데이터 구조 파악이다. 이 데이터들이 왜 수집되고 있는 지?를 생각해보자 

이는 PBL 프로젝트에 앞서서 문제 포인트를 도출하기 위한 단단한 체력과 같은 과정이다.

 

2. 문제 정의(w.질문) - 데이터 분석 방향성 기획 
📝 목적 : 데이터 분석의 목적과 목표, 방향성을 정하기 위함 

 

  • 문제 정의에 따른 질문/가설 수립
    → ex: "신규 유입 고객의 첫 구매 전환율은 5% 이상이면 전환율이 떨어진다고 볼 수 있지 않을까?"
  • 데이터 분석의 목적과 목표, 방향성 설정
    → 분석의 목적을 잡고 방향성 설정하기
    분석의 목적은 3가지(현황 파악 / 문제 정의 / 가설 검증)로 분류해보면 좋다. 

 Check: "무엇이 문제인 지, 무엇을 알고 싶은 지(어떤 질문에 답할 것인지), 왜 확인하고자 하는 가?" 

 

분석을 시작하기 전 분석 방향성을 잡기 위한 기획 단계라고 볼 수 있다. 

나는 이 과정이 가장 중요한 첫 단추이자 분석의 절반 이상을 차지한다고 생각한다. 

(*이 과정에서 타파트와의 잦은 소통을 통해 이해도를 높이고 그들의 맥락과 의도를 이해하는 건 필수이다) 

 

1번을 기준으로 해서 시뮬레이션을 그려가며 어떤 질문에 답을 낼 수 있을 지 고민하고 구체화해야 한다.

그렇게 되면 분석의 방향성이 자연스럽게 따라온다.

 

즉 "무엇을" "왜" 분석하고자 하는 가에 답변을 할 수 있어야 한다. 

3. 데이터 수집 or 추출
📝 목적 : 데이터 분석의 목적과 목표, 방향성을 정하기 위함 

 

  • 쿼리 설계 or 수집 경로 정의
    → 필요한 데이터만 뽑기 (필요한 조건 필터링)
  • 수집 방식 결정
    → SQL, BigQuery, CSV 파일 다운로드 등 선택
  • 데이터 스냅샷 저장
    → 중간에 데이터가 바뀔 수 있으니 첫 수집 시점 백업, 로우 데이터 유지 

Check: "질문에 맞는 데이터만 수집했는가?"

 

데이터를 수집하는 과정에서 로우데이터를 유지하는 것이 중요,

많은 데이터를 수집하게 될 경우, 데이터가 꼬이는 문제 발생 → 핵심 정보만 필터링하는 게 주요 Point 

 

4. 데이터 분석
📝 목표 : 핵심 문제를 풀기 위한 가설 수립, 데이터 속에서의 인사이트 발굴을 위한 탐색 과정 
  • 질문/가설 수립
    → ex: "신규 유입 고객의 첫 구매 전환율은 5% 이상일까?"
  • 분석 프레임워크 선정
    → AARRR 퍼널 분석, 가설검증 분석, KPI 분석, 코호트/세그먼트 분석 
  • 탐색적 데이터 분석 (EDA)
    → 기초 통계, 그룹별 비교, 분포 확인
  • 시각화로 패턴 확인
    → 히트맵, 트렌드라인, 퍼널 차트 등 활용

Check: "가설을 검증할 수 있는 분석을 했는가?"

 

분석 방법을 틀로 만들기 위해서는 "분석 프레임워크"를 이용하는 것이 중요하다.

하나의 공통점으로 묶고 틀 안에서 프로세스를 잡기 위해서는 꼭 필요한 장치인 것 같다.

 

5. 인사이트 도출
  • 데이터 기반 결론 도출
    → '수치'로 증명된 사실 중심으로 요약
  • Why 분석
    → 왜 이런 결과가 나왔을까? (추론 시도)

Check: "데이터에서 의미 있는 패턴을 읽어냈는가?"

 

여기서 중요한 건 사실 중심의 요약과 함께 "해석"할 수 있는 능력인 것 같다.

제품 ↔ 데이터 ↔ 고객 을 연결 짓는 가장 중요한 단계!

 

데이터 분석가의 중요한 역량이라고 생각한다. 

최근 읽은 "문과생, 데이터 사이언티스트 되다" 책에서 이야기한 부분 중

데이터사이언티스트의 중요 역량인 "인문학적 소양"이 발휘되는 부분!

 

문과생이어도 데이터 분석가 할 수 있다는 포인트가 가장 많이 발휘되는 부분이 아닐까 싶다. 

 

6. 개선 아이디어 정리
  • 구체적 개선안 제시
    → ex: 상세페이지 이탈률 70% → 제품 USP 강조 배너 삽입
  • 실행 가능성 고려
    → 실현 가능한 작은 액션부터 제시
  • 다음 분석 아이디어 제안
    → 후속 분석 주제까지 생각하기

Check: "분석 결과를 다음 행동으로 연결했는가?"

 

개선 아이디어의 경우, 타 파트에 전달할 때에의 "아이디어"로 상대방의 말로 전달하는 게 중요할 것 같다. 

데이터 분석가는 전체적인 배경과 맥락을 이해하는 게 중요한 지점이 발휘되는 포인트!

 

실제 개선 아이디어가 적용까지 나아가려면 더더욱 기획 단계에서

그들의 의도를 파악하고 맥락을 이해하는 게 중요하다고 생각한다. 

 

이 글을 쓰면서, 공부하면서 다시 한번 느끼는 건

모든 단계에서 "왜" "어떤 것을 확인하고자 했는 지" 상기하면서 진행하는 게 가장 중요한 것 같다. 

 

잊지말자. 왜 이 분석을 하고자 했는 지, 계속해서 각 단계가 끝날 때 점검을 해보도록 하자.