sas의 proc means를 이용하여 그룹별로 사분위수를 구하는 방법을 알아보자.

이 방법은 표본층화추출방법을 사용했거나 기타등 데이터에서 사분위수 이상치제거 작업전에 q1, q3를 구하는데

많이 사용되는 방법이다.

 

 

 

먼저 이작업의 유의점은 이전과는 달리 그룹별로 먼저 proc sort를 이용하여 정렬을 해주어야 한다.

그룹별로 정렬작업을 하고 그 뒤는 이전과 같이 사진 처럼 proc means를 이용해 q1과 q3를 구하면 된다.

대신 var cost - cost라는 연속형 변수에 대해 q1과 q3를 구하는데 우리는 이번에는 그룹별로 구할 것이므로

그전에 by group 라는 문구를 입력해준다.

 

그럼 사진의 맨 아래부분과 같이 그룹 a와 b별로 각각의 q1과 q3를 구할수 있다.

 

_type_과 _freq_는 proc means를 사용하여 자동으로 생기는 변수들인데 보기 싫다면

drop또는 keep을 이용해 원하는 변수만 볼수 있다.

 

www.sasbigdata.com 김진휘