본문 바로가기

책 리뷰

데이터 문해력 - 어떻게 데이터를 활용할 수 있을까?

업무할 때 제대로 데이터를 분석하고자 읽기 시작했던 데이터 관련 3번째 책이다. 

'데이터 문해력'은 보다 자세하게 어떻게 데이터 분석을 하면 되는지 가이드를 알려준다.

 

이 책을 읽고 나니 지금까지 해왔던 데이터 분석 업무는 단순히 현상 파악을 위한 작업이었던 것 같다.

데이터 분석 업무가 단순히 데이터를 가공하여 결과를 얻는 것에 그치는 것이 아니라, 문제 해결을 위한 소스로 활용될 수 있도록 데이터 분석 프로세스를 정리해본다.

데이터 문해력 책 표지

 

보통 업무에서 본격적인 기획을 하기 전 서비스의 현황을 파악하기 위해서 데이터 분석을 해왔다. 

데이터 분석을 해야한다고 생각하면 일단 관련된 데이터 지표는 무엇인지 고민해서 개발팀에 raw data를 요청하고, 이 데이터를 예쁘게 시각화할 수 있는 궁리를 하는 데 시간을 써왔다. 

 

하지만 데이터에서 인사이트를 뽑아내고 실제로 업무에 활용하기 위해서는 아래와 같은 순서로 데이터 분석을 진행해야한다고 한다. 

데이터 분석 프로세스

💡 데이터를 제대로 분석하기 위한 프로세스

1. 목적·문제 정의

  • 무엇을 알고 싶은지, 어떤 문제를 해결하고자 하는지 구체적이고 명확한 언어로 정리하기
  • 논리적이고 객관적인 결과물을 도출하기 위해서는 해결하고자 하는 '문제', 문제를 일으키는 '원인' 또는 이 문제를 해결하고자 하는 '목적'을 정의해 전체적인 데이터 분석 프로세스와 구조를 짜야 함
  • 목적·문제를 모호하게 설정한 상태에서는 우연히 눈에 띈 데이터를 모아 시각화해도 의미있는 결론 도출이 어려움

2. 데이터 지표 결정

  • 목적과 문제의 원인을 파악할 수 있는 지표 찾기.
  • 해당 지표를 어떻게 활용하고 싶은지에 대한 그림을 그린 후 설정해야 함. 무작정 데이터를 보고 문제를 도출하는 경우, 원하는 결과를 얻기 힘들고 결과와 적합하지 않은 데이터를 분석하게 될 가능성이 높음 
  • 문제에서 활용한 용어에 대한 기준을 구체화 하는 작업이 필요할 수 있음
    ex) '다양하다' → 개수가 많다, 특정 기간 동안 변경되는 빈도가 잦다 등

 

3. 현황 파악

  • 평가를 가능케하는 가치있는 정보는 '구체적인 행동'을 특정할 수 있어야 함
    ex) 누가 언제 무엇을 했는지
  • 서비스 기획에 적용해보자면, 시간대별 구매 건수나 유입경로별 회원가입자 수 등의 추이를 파악하는 것

 

 

4. 평가

  • 현황에 대한 가치 판단을 하는 것
  • 'A 상품은 금요일 오후 6시 퇴근시간 전후에 판매 효과가 좋았다', '2030 대상 인스타그램 마케팅을 통한 회원가입 전환이 효율적이다'와 같이 관점을 부여하는 것  
  • 데이터 값의 편차가 큰 경우, 평균과 비교하면 동떨어진 결론을 내릴 수 있으니 유의해야 함

 

5. 원인 분석

  • 1번째 방법 - 시각적 관련성 찾기
    ex) 그래프에서 우상향/우하향하는지, 상승-하강을 반복하는지, 특정 구간에 값이 몰려있는지, 특정 지점에서 급격하게 변경하는지 등 파악
  • 2번째 방법 - 상관계수 활용하기
    ex) 엑셀에서 CORREL 함수 활용  

 

6. 해결방안 모색

  • 각 원인을 해결하기 위해 적용할 수 있는 방법 찾기
  • 전체적인 로직을 무시한 채 완전히 새롭게 문제를 해결하는 방식을 제시하면 논리적 비약이 발생하기 쉽고 관련성이 부족하여 설득력을 갖기 어려움