Case Study

실전 데이터 분석 35 - 필수 데이터 분석을 통해 ROI 높이기

쭈경잉 2025. 8. 24. 00:14

비즈니스 데이터 분석에 있어 특히 중요한 건 ROI 관점에서 데이터 분석을 해야 한다는 것

 

즉, 완벽한 데이터 분석(사실 존재하지도 않는 것 같긴 하지만..)을 하기 보다는

업무 리소스 대비 시간 안에 최대한 효율적으로 하는 게 필요한 것 같다.

 

필요하고 핵심적인 분석을 빠르게 착수하는 것이 중요하다.

이번 분석을 하면서 느낀 건 분석을 함에 있어서도 "기획력"이 중요하다는 것 -

 

방향성을 잡고 안건을 기획해서 지금의 현 상태에서 할 수 있는 것들을 파악하고

계획을 잡아서 데이터 정리 > 과정 기록 등을 해두면 이후 분석 건에도 도움되고 Lesson&Learned 를 할 수 있다. 


[CASE 8] 필요한 파일이 어디에 있는 지 모른다.
  1. 데이터 관리 중요성 > 언제 어떤 데이터를 받았고 어디에 보관되어 있는 지 정확한 파악 필요
  2. 데이터 정리할 때 규칙 정해 기계적으로 하기
    1. 폴더 구조 템플릿화 : 로우 데이터 > 정리한 파일 > 분석 스크립트 등으로 별도 정리
    2. 파일 명명 규칙 설정 : 버전 중심 파일명 정하고 최신 파일 확인 가능하도록 구분
    3. 작업 중간에 생성된 파일, 분석에 사용한 파일 별도 정리

➡️ 이미 하고 있는 부분이지만 구체적으로 한 줄로 정리해 기록해보자

즉, 이후 확인할 때 이게 뭐였지?라고 확인하는 시간을 줄이기 위해 그때그때 정리하고 기록해두는 건 필수다.

 

[CASE 10] 데이터 분석가끼리 커뮤니케이션이 잘 안된다.
  • 기본 정보 : 분석 요청자 / 데이터 취득 방법 / 분석 스크립트 저장 위치 / 보안리스트
  • 데이터 정비 : 데이터 각 항목 갖는 의미 / 결측값과 이상값의 종류와 대처법 / 필요한 전처리 무엇인가
  • 분석 내용 : 독립변수 선택 이유 / 변수 변환 실시 이유 / 분석 기법과 모델 선택 이유
  • 현재 상황 평가 : 분석 결과의 정밀도 / 분석 요청자의 평가 / 운용 상황 / 고려 가능한 개선방법

➡️ 업무 인수인계와 아카이빙을 위해 해당 내용을 정리하자

이 부분은 데이터 분석을 함에 있어서도 흐름 기록, 리터러시 역량 향상에 필요한 과정이다. 

 

[CASE 11] 분석 요청자의 요구를 다 맞춰주려다 시간이 부족해졌다.
  • 분석 요청자의 요구사항 중 하나만 먼저 집중하고 무엇을 가장 알고 싶어 하는 지 파악해 해당 분석 집중하기

분석을 하다보면 이것도 알고 싶고 저것도 알고 싶은 경우가 많다.

그렇기 때문에 하나에 집중하며 순차적으로 끝내는 게 매우 중요하다. 

(*안건이 많아질 수록 복잡해지고 해석의 난이도가 올라간다. 그렇기에 복잡하게 보고 열어두고 분석하는 건 좋지 않다) 

 

[CASE 12] 새로운 분석 기법에 도전하다 보니 시간이 모자란다

데이터 분석에는 확실성과 목표 의식 필요하다.

> 확실한 결과를 낼 수 있는 기법으로 분석, 여유가 있다면 최신 기법 분석 진행해 새롭게 시도해보자

 

모든 업무가 그렇듯 중간 공유가 필수적이다. 지속적인 소통을 통해 의견을 전달하고 업무 우선 달성 뒤 새로운 걸 시도해보자.

할 건 해야하니까 ROI 계산은 필수다.

 

[CASE 13] 불필요한 모델 구축에 시간도 돈도 다 허비했다.

데이터 분석의 본질은 데이터에서 사실을 발견하고 이를 토대로 액션을 실행한다는 데에 있다.

즉, 담당자들의 감과 경험이 유용할 때가 있다. 이럴 때는 분석을 통한 액션이 필요 없을 수 있다.

 

따라서 분석을 통해 무엇을 기대하는 지 명확히 하기 위해 분석 결과물 적당히 보여줄 것이 필요하다.

→ 때론 데이터 집계해 시각화하는 것만으로도 충분한 경우가 있다.

 

데이터 분석의 필요성을 검토하는 과정이 그 무엇보다 중요하다. 

 

[CASE 14] 데이터 현장을 상상하기도, 데이터를 이해하기도 어렵다.

데이터 현장 : 데이터가 발생하는 물리적인 장소나 환경에서 해당 데이터 값이 어떻게 입력됐는 지,

어떤 업무를 통해 갱신되는 지와 같은 배경 파악해야 한다. 

 

실제로 어떤 시점에서 어떻게 수집이 되는 지 맥락을 알지 못하면 데이터를 수집하는 데에도.

이후에 분석할 때 데이터를 해석하는 데에도 어려움을 겪는다. 

 

데이터가 발생하는 상황은 각양각색 > 데이터가 어떻게 발생하고 또 어떻게 이용되는 지 구체적으로 관찰해야 적절한 파악이 가능하다.

➡️ 데이터의 추후 활용과 이해력을 높이기 위해 데이터 발생 로직에 대해서 확인해보기

 

[CASE 16] 추가 데이터가 왜 필요한 지를 설명할 수 없다.

큰 단위로 집계된 샘플링 데이터만 사용 가능한 경우, 신뢰성 부족한 데이터 밖에 없는 경우 문제 발생

데이터를 추가 확보하는 데에 있어서는 비용 발생 > ROI 측면 고려 필요, 수집하는 데에 있어서 리소스 고려해야 한다.

 

특히 데이터 분석의 7~8할은 데이터 이해와 전처리 과정이다.

해당 데이터를 통계적으로 이해하고 문제에 적합하게 전처리를 하는 데 드는 시간도 고려하도록 해야 한다.

 

✏️ 현 시점에서 필요한 데이터 분석이 무엇인 지? 데이터 분석도 "임팩트"의 측면을 고려해야 하고 시기성도 고려되어야 한다. 데이터 분석이라고 다르지 않다고 생각한다. 
✏️ 데이터 정리, 처리, 분석 과정에 있어 상세한 기록을 통해 과정 아카이빙하며 데이터와 친해지기