basic data type (기본적인 데이터 종류)

데이터 분석과 시각화의 맥락에서 중요한 데이터 유형은 네가지 (nominal, ordinal, interval, ratio)이다.

스크린샷 2015-08-25 오전 10.50.42.png

데이터의 유형과 유형의 성격을 정확히 이해하는 것은 최초 데이터 수집 시 어떤 유형으로 데이터를 수집하는 게 적절할지 결정하는 일에서부터 이후 분석이나 시각화 과정에서 데이터 유형에 따라 할 수 있는/없는 일들이 결정되므로 중요하다.

1. nominal data (명목 자료)

2. ordinal data (순서 자료)

3. interval data (구간 자료)

4. ratio data (비율 자료)

5. discrete vs. continuous

위에 이야기한 "내려갈 수는 있어도 올라갈 수 없다"는 법칙은 비단 데이터 수집뿐만 아니라 분석이나 시각화에도 적용된다. (예를 들어 ratio 유형으로 수집할 수 있는 데이터를 ordinal 유형으로 수집하게 되면 나중에 평균을 계산한다든지 기타 보다 정교한 분석을 수행하기 어렵고 표현할 수 있는 방식 역시 나이 그룹별 히스토그램 정도로 제한되게 된다.)

-끝
(그림 인용: http://www.mymarketresearchmethods.com/types-of-data-nominal-ordinal-interval-ratio/)

 
82
Kudos
 
82
Kudos

Now read this

4차산업혁명, 인공지능, 그리고 HR

아래의 내용은 지난 4년 동안 빅데이터, 인공지능(기계학습) 기술을 HR 데이터에 적용하면서 배우고 경험했던 내용들입니다. 한 분야의 전문가로 불리기엔 짧은 기간이지만 HR데이터를 기계학습 기술로 분석하는 것이 워낙 새로운 분야인지라 국내나 해외에 전문가라고 자부할 수 있는 사람은 많지 않을 거라고 생각합니다. 지금은 국내나 해외 마찬가지로 HR 데이터 분석을 통해 비지니스 성과를 개선하는 일의 가능성과 한계를 시행착오를... Continue →