사이트맵  |  Contact Us
 
홈 > SAS Tech & Tip > SAS Enterprise Guide
[Excel보다 쉬운 SAS, SAS EG 따라잡기]25. 분산분석(일원분산분석) 2013.01.21
MYSAS 11305 2
http://www.mysas.co.kr/SAS_tiptech/i_eg.asp?b_no=2456&gotopage=5&con=subject&keyword=&cmd=content&bd_no=28&gubun=

 

Lesson25. 분산분석(일원분산분석)

*관련 메뉴 : 작업 – 분석 – 분산분석 – 일원분산분석

*Data Set : SASHELP.CARS

 

  들어가는 말

 

 안녕하세요. MYSAS 입니다.
오늘은 [분산분석]의 기본적인 개념과 [일원분산분석]을 배워 보겠습니다.

 

  Lesson

 

  

 

  1. 분산분석(Analysis of Variance, ANOVA)

 

 셋 이상의 모집단 간의 평균을 비교할 때 사용되는 통계적 방법입니다.

1) 종류
 분산분석은 독립변수의 개수에 따라 일원분산분석, 이원분산분석, 삼원분산분석 등이 있습니다. 이번 강의 및 다음 강의를 통해 일원분산분석과 이원분산분석에 대해 배워보겠습니다.

2) F-분포
 분산분석에 쓰이는 분포는 F-분포입니다. t-분포나 정규분포와 달리 양수의 구간에서만 확률값을 갖는 분포이고 모양 또한 대칭이 아닙니다.

만약, 한 집단이라도 나머지 집단과 차이가 난다면 귀무가설(H0 = 각 집단별 평균의 차이는 없다.)을 기각하게 됩니다.

 

  2. 일원분산분석(One-Way ANOVA)

 
Dataset: SASHELP.CARS의 형태

Origin(Aisa, Europe, USA)간의 EngineSize의 차이가 있는지 없는지 알아보겠습니다.

1단계: 일원분산분석 선택


2단계: 데이터 선택(종속변수: EngineSize, 독립변수: Origin)


3단계: 검정(Levene의 검정)

Levene의 검정을 하는 이유는 ANOVA검정을 할 때, 집단 별로 등분산성을 만족해야 하기 때문입니다. 만약, 등분산성을 만족하지 않을 시에는 Welch의 분산 가중 일원분산분석을 선택해야 합니다.

4단계: 평균, 도표, 결과(필요할 경우 선택)


5단계: Levene의 검정 결과

P-value: 0.0062 < 유의수준(0.05)
기각역에 포함되므로 귀무가설(H0 = 등분산성 만족)을 기각합니다.
즉, 등분산성을 만족하지 않습니다.

6단계: 작업수정을 통해 검정 선택으로 다시 돌아갑니다.
(Welchd의 분산 가중 일원분산분석: 가중 분산을 사용하여 그룹 평균을 검정합니다. 등분산성 가정이 기각되었을 경우 이 검정을 사용합니다.)


7단계: 결과

Origin의 P-value: <.0001 < 유의수준(0.05)
기각역에 포함되므로 귀무가설(H0 = 그룹간의 차이가 없다.)을 기각합니다.
즉, (Aisa, Europe, USA) 간의 EngineSize가 차이나는 국가가 있을 것으로 예상됩니다.
R-square: 0.109565이므로 이 모형에서 Origin는 EngineSize에 대한 변동성을 약 11% 정도 설명한다고 볼 수 있습니다.

 

 

  차회 예고 > 분산분석(이원분산분석)

 


 

 

  QUIZ

 


 

 Lesson23. 정답

 

Q. 회귀분석에서 설명변수가 증가하면 R-square 값은 증가할까요? 감소할까요?


 일반적으로 회귀분석에서 설명변수가 증가할수록 R-square 값을 증가합니다. 이를 보완하기 위해 Model끼리 비교시 Adj_R_square값을 비교해야 합니다.

 

 이번 회 QUIZ

 
Q. group간의 size가 차이가 있는지 없는지 분석하는 실습예제(첨부파일: one_way_anova)입니다. 유의수준(0.05)기준으로 해주세요.

Dataset: one_way_anova의 형태


예시 답변)
Levene 검정결과
   P-value: 0.7542 > 유의수준(0.05): 등분산성 만족
Welch 검정으로 다시 분석할 필요 없음.
ANOVA Table 결과
   P-value: 0.0112 < 유의수준(0.05): 그룹간의 차이가 존재.

Levene 검정결과
   P-value: 0.0004 < 유의수준(0.05): 등분산성 만족하지 않음.
Welch 검정으로 다시 분석 필요.
ANOVA Table 결과
   P-value: 0.7112 > 유의수준(0.05): 그룹간의 차이가 없음.

쪽지 보내주세요~~소정의 상품이 있습니다!!
정답을 맞추신 분들중 추첨을 통해 10명에게
스타벅스 카페라떼 1잔씩 보내 드립니다. 많은 참여 부탁드립니다.
참고로 회원정보 수정에 가셔서 본인의 핸드폰이 맞는지 확인 한번 해주세요.
정답 발표 날 : 2013.01.28(월요일)


감사합니다.

  

MYSAS 올림.

 
 

 
  one_way_anova.sas7bdat
다운로드 수 | 33
김현우   [2013/01/21 5:44]
좋은 글 감사합니다.
휴대폰 번호
휴대폰 인증번호
 
 [Excel보다 쉬운 SAS, SAS EG 따라잡기]26. 분산분석(이원분산분석)
 [Excel보다 쉬운 SAS, SAS EG 따라잡기]24. 회귀진단(잔차 도표와 이상점, 영향점, 다중공선성)