What I Talk About Data Viz. When I Talk About Data Viz.
데이터 시각화는 - 담백하게 정의하자면 - 숫자를 점, 선, 면(도형)을 활용해서 크기, 위치, 색상으로 표현하는 일이다.
데이터 시각화가 의미있는 근본적인 이유는 날것의 데이터/숫자보다 시각적 신호가 이해하고 기억하고 관련된 의사결정을 내리기 쉽기 때문이다. (사람의 뇌가 처리하는 시각 정보가 9Mb/sec 정도라고 하는데 사람의 두되는 시각적 정보를 잘 해석하도록 진화해 왔다. 한편, 엑셀을 볼 때는 cortisol이라는 스트레스 호르몬이 엄청 분비된다고…)
Medium
데이터 시각화는 의미를 전달하기 위한 도구이고, 그렇기 때문에, 매체이다. Data Visualization이 데이터의 의미를 전달하는 매체로서 기능하기 위해서는 아래 네가지 질문이 중요하다.
- 어떤 데이터를 가지고 있나?
- 데이터를 통해 알고 싶은 게 무엇인가?
- 알고 싶은 걸 잘 알기 위해 어떤 시각화 방법이 효과적인가?
- 알고 싶은 것이 잘 표현되었나? 시각화 방법이 적절했나?
Abstraction
또 다른 관점에서 데이터 시각화를 표현하자면 Dat Viz.는 현실의 추상화이다. 데이터 수집은 현실 세계를 sampling(추상화)하는 것이고, 데이터 시각화는 이런 추상화된 데이터에 대한 추가적인 추상화(abstraction)이다.
추상화의 과정에서 정보는 필연적으로 삭제/압축될 수밖에 없다. 사용자(audience)가 시각화에 사용된 시각적 신호(visual cues)를 해석할 수 없다면 시각화가 아무리 예쁘게 표현되었다 한들 실패한 Data Viz.이다.
Statistical Narrative
시각화는 종종 Storytelling의 새로운 형식으로 거론되기도 한다. 여기서 이야기라고 함은 전통적 서사라기보다는 통계적 이야기(statistical story)에 가깝겠다.
데이터 스토리텔링이 전통적 스토리텔링과 비교해서 더 큰 의미를 가질 수 있는 경우는 전통적 스토리텔링의 주된 소재가 되는 일화(anecdotal storytelling)의 일회성/우발성을 극복하고 데이터를 통해서 발견한 패턴을 이야기할 때이다. (anecdotal은 “입증되지 않은"이라는 뜻도 있다.) 즉, 데이터를 통해 일관되게 드러나는 패턴을 보여주고 결론으로 이끄는 귀납적 storytelling이 가능한 것이다.
이미지는 nathan yau의 data points 책 내용을 참고 했습니다.