basic data type (기본적인 데이터 종류)

데이터 분석과 시각화의 맥락에서 중요한 데이터 유형은 네가지 (nominal, ordinal, interval, ratio)이다.

스크린샷 2015-08-25 오전 10.50.42.png

데이터의 유형과 유형의 성격을 정확히 이해하는 것은 최초 데이터 수집 시 어떤 유형으로 데이터를 수집하는 게 적절할지 결정하는 일에서부터 이후 분석이나 시각화 과정에서 데이터 유형에 따라 할 수 있는/없는 일들이 결정되므로 중요하다.

1. nominal data (명목 자료)

2. ordinal data (순서 자료)

3. interval data (구간 자료)

4. ratio data (비율 자료)

5. discrete vs. continuous

위에 이야기한 "내려갈 수는 있어도 올라갈 수 없다"는 법칙은 비단 데이터 수집뿐만 아니라 분석이나 시각화에도 적용된다. (예를 들어 ratio 유형으로 수집할 수 있는 데이터를 ordinal 유형으로 수집하게 되면 나중에 평균을 계산한다든지 기타 보다 정교한 분석을 수행하기 어렵고 표현할 수 있는 방식 역시 나이 그룹별 히스토그램 정도로 제한되게 된다.)

-끝
(그림 인용: http://www.mymarketresearchmethods.com/types-of-data-nominal-ordinal-interval-ratio/)

 
81
Kudos
 
81
Kudos

Now read this

하나를 보면 열을 안다? 인재 발굴엔 毒

[한국경제신문에 2016.12.08일에 기고한 글입니다.] ‘사람 일은 모른다’는 말이 있다. 그러나 빅데이터를 활용한 인재분석 기술 ‘피플 애널리틱스(people analytics)’를 활용하면 이런 말을 하기 어렵다. 피플 애널리틱스는 사람(직원)과 일(성과)의 관계에 대해 객관적으로 이해할 수 있는 인재경영의 도구다. 세계 주요 기업의 관심이 높아지고 있는 이유다. 국내에서는 데이터 기반 의사결정(DDD:... Continue →