로그인   |  회원가입  |  사이트맵  |  Contact Us
  아이디 저장하기
 
홈 > SAS Tech & Tip > SAS 자격증 준비
[SAS BA 자격증 준비] 4. ANOVA - 2 2017.10.19
김서연 524 2
http://www.mysas.co.kr/SAS_tiptech/c_base.asp?b_no=7493&gotopage=1&con=subject&keyword=&cmd=content&bd_no=42&gubun=

안녕하세요! :)

 

지난주에 이어서, 이번에는 ANOVA의 두 번째 내용에 대하여 알아보겠습니다.

 

 

 

 

 

Two-Way ANOVA

지난번에 배울 때 ANOVA는 반응변수가 연속형이라고 배웠습니다. One-Way ANOVA​의 경우에는 연속형 변수가 하나이며, 반대로 연속형 변수가 2개 이상일 때에는 그 개수만큼 n-Way ANOVA​라고 부릅니다. 이번에는 반응변수가 2개인 Two-Way ANOVA​에 대하여 배워보겠습니다.

One-Way ANOVA와 동일하게, Two-Way ANOVA​에도 모델이 존재합니다. 그 모델은 다음과 같습니다. 이 때, α​와 β​ ​두 연속형 변수에 의한 Two-Way ANOVA 모델의 모형입니다.


​위 모델은 지난주에 배운 것과 동일하게 3가지 가정 (독립, 등분산성, 에러의 정규성)을 따릅니다.

 

  • Y​ijk는 α​와 β​데이터를 바탕으로 변화하는 최종 값을 의미합니다.
  • μ​는 전체 데이터의 평균입니다.
  • α​i는 α​에 의한 주효과 (Main Effect)로, α​​변수 하나만으로 변화하는 정도를 의미합니다.
  • β​j 역시 β에 의한 주효과입니다.
  • αβ​​ij는 α와 ​β​에 의한 상호작용 효과(Interaction Effect)로, 둘 이상의 반응변수의 상호작용에 의한 변화 정도를 나타냅니다.
  • 마지막으로 ​ε​ijk는 말 그대로 에러값입니다.

 

 

Two-Way ANOVA에 대한 SAS 예제 코드와 결과값은 다음과 같습니다.

 


 

현재 두 개의 반응변수들은 Heating_QC, Season_Sold임을 코드 상에서 알 수 있습니다.

 

1. TYPE I SS : Heating_QC 변수가 처음 추가되었을 때의 SS (Sum of Square), Season_Sold가 그 다음으로 추가되었을 때 Season_Sold 변수가 설명하는 SS값을 나타냅니다. 이는 변수가 추가되는 순서에 따라 영향을 받습니다.

 

2. TYPE III SS : 상호작용을 고려하고, 모델에 두 변수가 모두 포함되어 있을 때 각 변수들의 SS를 나타냅니다. 변수의 순서는 무관합니다. 현재 예제에서는 Heating_QC 변수만 변화가 나타남을 알 수 있습니다.

 

3. TYPE II SS : 위 예제의 결과에는 없지만, TYPE II SS는 상호작용을 고려하지 않고 모델에 변수가 모두 들어가 있을 때의 SS값들입니다. 이 역시 변수의 순서에 영향을 받지 않습니다.

 

 

 

 

 

 

 

Interaction

Interaction이란, 위의 모델에서 상호작용 효과 때 설명한 바와 같이 한 변수의 변화에 따라 다른 변수의 변화, 즉 한 변수에 변화를 주었을 때 그룹의 평균 변화 정도를 의미합니다. 이러한 상호작용의 유무를 알아보기 위하여 ANOVA를 돌리기 이전에 mean plot을 통하여 알아보아야 합니다.


 

해당 그림은 각 Disease A, B에 혈압과 약의 상호작용 효과가 존재하는지 알아보는 예제 그림입니다. 왼쪽 그림의 경우 두 Disease는 약과 혈압에 대한 동일한 작용을 받고 있기 때문에 (두 기울기가 동일), 상호작용이 없다는 결론을 내릴 수 있습니다. 하지만, 오른쪽 그림의 경우 약의 양이 증가할수록 Disease A는 혈압이 감소하지만 Disease B는 혈압이 증가하고 있습니다. 이런 경우에 상호작용 효과가 존재한다고 말할 수 있어 모델에서 αβ​​ij를 사용해주어야 합니다. 상호작용 효과가 존재하지 않는 왼쪽 그림과 같은 경우에는 각 변수들의 주효과 만으로도 충분히 설명 가능하기 때문에, 모델 수식에서 αβ​​ij를 지워주어도 됩니다.

이렇게 모델에서 상호작용을 지울 때에는 위의 그래프를 통하여 확인하는 과정도 중요하지만, 주로 자유도가 5보다 작을 때, 그리고 상호작용항의 F값이 2보다 작을 때 삭제합니다.

 

상호작용이 존재하는 경우 SAS 코드는 다음과 같습니다.

PROC GLM;

MODEL A B A*B;

or

MODEL A|B;

RUN;

QUIT;

MODEL A B A*B 처럼 각 효과들을 하나하나 적어줄 수도 있으며, *로 연결된 변수들은 서로 상호작용이 있는 것을 의미합니다. 또한, 아래 MODEL A | B와 같이 |로 연결된 변수들 역시 서로 상호작용이 존재하는 것으로 인식됩니다. 두 문장 중 하나를 사용하면 됩니다.

 

 

 

 

 

이것으로 SAS BA 자격증 준비의 4번째 내용을 마무리하겠습니다.

 

감사합니다!

 

 

 

 

 

 
 
    
 
 [SAS BA 자격증 준비] 5. Regression
 [SAS BA 자격증 준비] 3. ANOVA - 1