대응비교를 위한 t-검정은  각 대응하는 자료값의 차에 대한 표본평균이 특정한 상수와 같은지를 검정하는 방법이다.

 

다음의 예는 대응표본 t-검정을 위해 임시로 만든 30개의 데이터이다.

개정전의 값이 before이고 개정후의 값이 after이라고 설정하고 새로운 방법이 기존의 방법보다 효과적이라고 판단할 수 있는지 대응비교의 T-검정을 통해서 알아보자.

 

 

 

데이터 D_test는 before(개정전의 값), after(개정후의 값) 두개의 변수로 구성되어 있으며

총 관측치 수는 30개인 데이터셋이다.

 

 

 

paired variables;

대응비교에 사용되어질 변수를 지정하는데, 하나 이상의 변수를 지정할수 있으며 * 또는 : 으로 구분한다.

*는 좌우 각 변수를 짝지어 분석한다.

:은 좌우 변수를 순서적으로 짝지어 분석한다. 즉, :는 좌우 변수의 수가 일치해야 한다.

대응되는 변수의 차이가 계산되며, paired는 대응비교 문장이므로 class 나 var 문장이 함께 사용되지 않는다.

 

      

  코딩 예시 

  코딩 의미 

  paired a*b;

  a-b 

  paired a*b c*d;

  a-b, c-d

  paired (a b)*(c d); 

  a-c, a-d, b-c, b-d

  paired (a b)*(c b);

  a-c, a-b, b-c

  paired (a1-a2)*(b1-b2);

  a1-b1, a1-b2, a2-b1, a2-b2

  paired (a1-a2):(b1-b2);

  a1-b1, a2-b2

 

 

 

H0(귀무가설) : 개정후와 개정전의 차이가 없다.(효과가 없다.)

H1(대립가설) : not H0.

 

개정후(after)와 개정전(before)의 차에 대한 표본평균값이 12.433으로 개정후의 값의 결과가 높게 나왔다.

이에 대한 t-값이 4.5, 유의확률이 0.0001로 나타나 유의수준을 엄격하게 적용해 α=0.01을 적용해도 개정후의 값에 대한 방법이 개정전의 방법보다 높다고 결론 내릴 수 있다. 정확하게는 차이가 아닌 높고 낮음을 보기 때문에 단측검정으로 결과를 해석하려면 유의확률값을 2로 나누어 해석하여야 한다. 그러면 유의확률은 0.0001/2=0.00005가 된다.

 

유의확률값이 0.00005(단측검정)이므로 유의수준 0.01보다 작으므로 귀무가설을 기각한다.

즉, 개정 후의 방법이 개정 전의 방법보다 효과가 있다고 볼 수 있다.

 

www.sasbigdata.com 김진휘