로그인   |  회원가입  |  사이트맵  |  Contact Us
  아이디 저장하기
 
홈 > SAS Tech & Tip > 쉬운 SAS, SAS EG
[Excel보다 쉬운 SAS, SAS EG 따라잡기]26. 분산분석(이원분산분석) 2013.01.23
MYSAS 6244 1
http://www.mysas.co.kr/SAS_tiptech/i_eg.asp?b_no=2470&gotopage=1&con=subject&keyword=&cmd=content&bd_no=28&gubun=

 

Lesson26. 분산분석(이원분산분석)

*관련 메뉴 : 작업 – 분석 – 분산분석 – 선형모형

*Dataset: EX(개인적으로 만든 Dataset)

 

  들어가는 말

 

 안녕하세요. MYSAS 입니다.
오늘은 [분산분석]의 [이원분산분석]을 배워 보겠습니다.

 

  Lesson

 

  

 

  이원분산분석(Two-Way ANOVA)

 

 두 개 이상의 독립변수와 종속변수의 관계에 대해 분석하는 방법입니다. 여기서는 추가적으로 주 효과 외에도 독립변수끼리 연관성(교호작용)이 있는지 볼 수 있다는 장점이 있습니다. 주로 실험계획법 데이터에서 많이 사용 됩니다.

주의!!
 독립변수의 주 효과는 유의하지 않지만, 교호작용이 유의한 경우가 있기 때문에 조심해야 합니다. 이 경우 독립변수는 유의 하지 않지만, 포함 시켜야 합니다.

교호작용 존재여부 확인 방법
 독립변수들끼리 선도표를 그려 확인합니다. 동일한 조건에서 실행 횟수가 2회 이상일 경우 종속변수의 평균값을 이용해야 합니다.
1) 교호작용이 존재하는 경우

2) 교호작용이 존재하지 않는 경우


Dataset: EX의 형태

동일한 조건에서 실험횟수가 2회 이상이므로 그래프로 교호작용 존재 여부를 판단 시
y의 평균값을 이용해야 합니다.

교호작용의 존재 여부 그래프 확인
1) MEAN_of_y*V

겹치는 부분이 존재 하지 않기에 교호작용이 존재하지 않을 것으로 예상됩니다.
2) MEAN_of_y*E

겹치는 부분이 존재 하기에 교호작용이 존재할 것으로 예상됩니다.
따라서, 분석할 때 교호작용 효과도 첨가하여 분석을 진행 하겠습니다.

1단계: 선형모형 선택


2단계: 데이터 선택(종속변수: y, 설명변수: E, V)

E, V 변수는 수치형 변수인데 왜 양적변수가 아닌 분류변수에 넣은 이유는?
E, V 변수들의 값을 보면 연속된 값이 아닌 분류의 의미를 가지고 있기 때문입니다.
(E: 60, 90, 150 / V: 127, 220)

3_1단계: 모형


3_2단계: 모형(요인효과 클릭)

요인효과: 주 효과와 교호작용 효과를 동시에 적용됩니다.

4단계: 모형옵션(Type1, Type3: 기본)

Type1의 제곱합: 모델의 순서에 의존하는 제곱합입니다.
Type3의 제곱합: 모델의 순서와 상관없는 제곱합입니다.
차이가 있다면, Type1 제곱합을 모두 더하면 모델의 제곱합과 일치합니다.

5단계: 결과

Type1 과 Type3의 차이가 없다는 것을 알 수 있습니다.

1) Model의 P-value: 0.0001 < 유의수준(0.05)
기각역에 포함되므로, 귀무가설(H0 = 위 Model은 유의하지 않다.)을 기각합니다.
즉, 위 Model은 유의하다는 것을 알 수 있습니다.

2) 주 효과 및 교호작용 검정
E 의 P-value: <.0001 < 유의수준(0.05)
기각역에 포함되므로, 귀무가설(H0 = E는 유의하지 않다.)을 기각합니다.
즉, E는 유의하다는 것을 알 수 있습니다.
V 의 P-value: 0.0875 > 유의수준(0.05)
기각역에 포함되지 않으므로, 귀무가설(H0 = V는 유의하지 않다.)을 기각하지 못합니다.
즉, V는 유의하지 않다는 것을 알 수 있습니다.
E*V 의 P-value: 0.0357 < 유의수준(0.05)
기각역에 포함되므로, 귀무가설(H0 = E*V는 유의하지 않다.)을 기각합니다.
즉, E*V는 유의하다는 것을 알 수 있습니다.

종합하면, 위 Model에서 V 변수를 제거하는 것보다는 포함해야 합니다.
 

 

  차회 예고 > 범주형자료분석(교차분석)

 


 

 

  QUIZ

 


 

 Lesson24. 정답

 

Q. 
Dataset: SASHELP.CARS를 이용하여
종속변수: Weight
설명변수: EngineSize, Cylinders, Horsepower, MPG_City, MPG_Highway, Wheelbase, Length
으로 다중 회귀를 돌렸을 때(다른 추가 조건은 없습니다. 예를 들어 모델 선택 등), 다중공선성이 의심가는 변수들을 선택해주세요.


MPG_City, MPG_Highway의 VIF > 10 이므로 다중공선성이 의심됩니다.
 

 

 이번 회 QUIZ

 
Q. Dataset: ex_1
종속변수: y
독립변수: Factor_A, Factor_B
가 있습니다. 유의수준(0.05) 기준으로 Factor_A와 Factor_B의 교호작용이 유의한지 하지
않은 지 검정해 주세요.

Dataset: ex_1의 형태


예시답변)
E*V 의 P-value: 0.0357 < 유의수준(0.05)
기각역에 포함되므로, 귀무가설(H0 = E*V는 유의하지 않다.)을 기각합니다.
즉, E*V는 유의하다는 것을 알 수 있습니다.


쪽지 보내주세요~~소정의 상품이 있습니다!!
정답을 맞추신 분들중 추첨을 통해 10명에게
스타벅스 카페라떼 1잔씩 보내 드립니다. 많은 참여 부탁드립니다.
참고로 회원정보 수정에 가셔서 본인의 핸드폰이 맞는지 확인 한번 해주세요.
정답 발표 날 : 2013.01.30(수요일)


감사합니다.

  

MYSAS 올림.

 
 

 
  ex.sas7bdat
ex_1.sas7bdat
다운로드 수 | 35
    
김현우   [2013/01/24 10:59]
좋은 글 감사합니다.^^
 
 [Excel보다 쉬운 SAS, SAS EG 따라잡기]27. 범주형 자료분석(교차분석)
 [Excel보다 쉬운 SAS, SAS EG 따라잡기]25. 분산분석(일원분산분석)