basic data type (기본적인 데이터 종류)

데이터 분석과 시각화의 맥락에서 중요한 데이터 유형은 네가지 (nominal, ordinal, interval, ratio)이다.

스크린샷 2015-08-25 오전 10.50.42.png

데이터의 유형과 유형의 성격을 정확히 이해하는 것은 최초 데이터 수집 시 어떤 유형으로 데이터를 수집하는 게 적절할지 결정하는 일에서부터 이후 분석이나 시각화 과정에서 데이터 유형에 따라 할 수 있는/없는 일들이 결정되므로 중요하다.

1. nominal data (명목 자료)

2. ordinal data (순서 자료)

3. interval data (구간 자료)

4. ratio data (비율 자료)

5. discrete vs. continuous

위에 이야기한 "내려갈 수는 있어도 올라갈 수 없다"는 법칙은 비단 데이터 수집뿐만 아니라 분석이나 시각화에도 적용된다. (예를 들어 ratio 유형으로 수집할 수 있는 데이터를 ordinal 유형으로 수집하게 되면 나중에 평균을 계산한다든지 기타 보다 정교한 분석을 수행하기 어렵고 표현할 수 있는 방식 역시 나이 그룹별 히스토그램 정도로 제한되게 된다.)

-끝
(그림 인용: http://www.mymarketresearchmethods.com/types-of-data-nominal-ordinal-interval-ratio/)

 
82
Kudos
 
82
Kudos

Now read this

Moneyball for Harvard Admissions

Steve Schwarzman이라는 사모투자로 억만장자가 된, 그리고 최근 예일 대학에 1600억 정도 기부하기로 하신 분이 1969년 하바드 대학 입학에 거절당했던 일이 알려진 걸 계기로 하바드 대학에서 최근 졸업 후 돈을 어마어마하게 번 (특히 금융 쪽에서) 졸업생들 데이터를 분석했더니 아래 세가지 자질이 발견되었다고 한다. self-importance: 통상 학교나 회사에서 사람을 선발할 때 자부심/자긍심은... Continue →