sas에서 그룹에 속한 데이터들 중에 특정값이 포함되있는 경우와 없는 경우의 건수를 알아내는 방법을 알아보자.

이 과정을 참 언어로 풀어내기가 어렵기 때문에 천천히 문제를 이해하고 과정을 알아본다.

아래의 사진을 참조하자.

 

 

알고싶은 것은 group별로 name의 관측값들중에 AQ로 시작하는 데이터값이 포함 되어 있는 경우와 아닌 경우가 그룹단위로 몇건인지를 알고 싶은 것이다. 결과 값과 비교해보면

c1인 경우 HD1은 AQ1과 같은 그룹에 속해있으므로 1건이 카운트 된다. 하지만 key변수 444에서 c1에서는 AQ1이 없으므로 아닌 경우도 1건이 카운트 되는 것이다. 이와 같이 HD2 또한 마찬가지로 카운트가 된다.

HD3인 경우에는 key변수 111의 c1그룹에는 아예 값이 없으며, key변수 444의 c1그룹에서도 AQ가 같은 그룹에 있지 않으므로 0건으로 카운트 되며 key변수 444에서 c1그룹에 HD3값은 있으나 AQ와 같이 있지 않는 경우 이므로 아닌 경우가 1건이 카운트 되는 것이다. e1그룹과 c1그룹도 같은 방법으로 카운트가 된다.

 

 

 

sas 코딩을 통해 위와 같은 결과를 나타낼수 있다. 아예 카운트 되지 않은 0건은 나타내지 않고 건수가 있는 경우만 출력하였다.

 

www.sasbigdata.com 김진휘