sas를 이용하여 각 그룹별로 그룹에 속해있는 값들을 가로로 치환? 나열하는 방법을 알아보자.

데이터의 크기가 작은 경우에는 엑셀로 하는 것이 빠르지만

빅데이터(bigdata) 시대에 대용량 데이터에서 엑셀로 작업을 하는 것은 거의 불가능에 가깝다.

sas를 사용해 간단하게 예제를 통해 알아보자.

 

 

위의 사진을 참고하자.

 

1. ace라는 데이터셋이 있다.

 

2. 그룹별로 어떤 데이터가 있는지를 먼저 알기 위해 proc sort를 통해 정렬을 한다.

   사진의 왼쪽 하단처럼 데이터가 group별로 code값이 정렬이 된다.

 

3. 그럼 이 코드들을 우측으로 촤악~ 나열을 해야한다. 이때 사용되는 구문이 proc transpose이다.

    proc transpose 상세 내용은 아래의 주소를 클릭.

    http://sasbigdata.com/68

 

4. 그다음 code값들을 우측으로 나열하면서 생긴 임의의 변수들 col1~col3를 원하는 변수로 rename시킨다.

   그리고 새롭게 생성된 필요없는 _name_변수를 drop시키면

   work.final 사진의 우측 하단 부분의 결과가 출력이 된다.

 

www.sasbigdata.com 김진휘