자료는 특성에 따라서 크게 3가지로 분류 할 수 있다.

 

 

 

 

자료의 종류는 크게 이산형 자료, 순서형 자료, 연속형 자료 세가지로 분류할 수 있다,

 

1. 이산형 자료(명목자료, 질적자료)

 

자료값이 양적인 크기가 아닌 속성이나 그룹을 나타내는 자료.

예를 들어 성별(남,여), 종교(불교, 기독교, 천주교), 지역(서울, 부산, 대전) 등을 나타내는 자료들이 속하며,

주로 그룹 분류시 이용된다.

- 변수가 성별(gender)이면 관측치는 (남자=1, 여자=2)

- 변수가 종교(religion)이면 관측치는 (불교=1, 기독교=2, 천주교=3)

 

2. 순서형 자료

 

서열이나 순위를 나타내는 자료.

시험점수를 석차로 나타낸 자료 또는 키가 큰 순서대로 배열, 몸무게가 많은 순으로 배열등

등위로 나타낸 자료가 속함. 원자료 자체가 순위를 나타내는 자료도 여기에 속함.

- 변수가 학점(grade)이면 관측치는 (A=2, B=4, C=6)

 

3. 연속형 자료(양적자료)

 

양적인 의미를 가지는 크기를 갖는 대부분의 자료들은 연속형 자료에 속함.

예를 들어 집평수, 시험점수, 몸무게, 키 등이 여기에 속함.

연속형 자료는 통계분석용으로 가장 적절하며, 연속형 자료에 대한 통계분석 기법이 비교적 많이 개발되어 있음.

- 변수가 점수(score)이면 관측치는 (70,75,90,88)

 

www.sasbigdata.com   김진휘