R프로그램(Rstudio)으로 데이터세트에서 조건에 맞는 내용을 조회하는 방법을 알아보자.

SAS로 비교한다면 if문장과 비슷하다고 보면 된다.

 

subset(dataframe,select=열이름) : 데이터세트에서 조건에 맞는 내용 조회

 

간단한 예제를 통해서 알아보자.

 

 

위의 그림은 Rstudio프로그램의 스크립트(Script)창에 명령어를 입력한 화면이다.

subset을 사용하여 조건에 맞는 값들을 출력한다.

코딩설명

iris는 iris라는 데이터프레임을 사용하는 말이다.

select= 부분은 iris의 Petal.Width와 Species 의 변수들을 결과를 출력한다는 내용이다.

subset= 부분은 Petal.Width 변수의 값이 0.3 미만인 경우라는 조건을 입력한 것이다.

 

[결과창]

 

 

위의 그림은 콘솔(Console)창으로 스크립트 창에서 실행한 명령문이 실행되는 것을 보여준다.

iris라는 데이터프레임에서 Petal.Width 변수의 값이 0.3 미만인 경우에 대한

Petal.Width와 Species 의 변수들의 결과값들을 조회해 준다.

 

 

비슷한 예를 통해 응용하여 보자.

 

위의 과정과 동일하지만 이번에는 조건이 두개인 경우이다.

 

 

select= 부분에 해당하는 변수들을 모두 조회하며

조건인 subset을 자세히 보면 중간에 &라는 기호를 볼 수 있다.

Petal.Length==1.4 & Petal.Width<0.3 이부분이 조건인데

Petal.Length의 값이 1.4 이고, Petal.Width의 값이 0.3보다 작은 경우에 대한 조건을 설정한 것이다.

SAS프로그램의 if문에서 and 조건이라고 이해하면 되겠다.

 

[결과 조회 콘솔창]

 

 

결과내용을 보면  Petal.Length의 값이 1.4 이고, Petal.Width의 값이 0.3보다 작은 경우에 대해서

select= 부분에 지정한 Sepal.Length, Sepal.Width, Petal.Length, Petal.Width, Species 의 변수들의 값들이

조회가 된 것을 알 수 있다.

 

www.sasbigdata.com 김진휘