로그인   |  회원가입  |  사이트맵  |  Contact Us
  아이디 저장하기
 
홈 > SAS Tech & Tip > SAS University Edition
SAS University Edition 시작하기 (13) : 분산분석 2015.04.30
최준 1419 0
http://www.mysas.co.kr/sas_tiptech/d_university_edition.asp?b_no=6355&gotopage=1&con=subject&keyword=&cmd=content&bd_no=36&gubun=

안녕하세요. 

 

MYSAS 홍보대사 최준입니다. 

학계의 교수님과 학생들의 간편한 SAS 사용을 위하여 SAS University Edition 무료 소프트웨어가 출시되었습니다. 

SAS University Edition은 직관적인 UI 환경이기 때문에 쉽게 사용할 수 있지만, 

아직까지 많은 홍보가 되지는 않은 것 같습니다. 

 

그래서 제가 미흡하지만, SAS University Edition 사용법, 및 기능에 대해서 연재해보고 있습니다. 

 

이번에는 SAS University를 이용하여 분산분석 하는 방법에 대해서 살펴보겠습니다.  

 


 

작업 -> 통계량 -> 일원분산분석을 드래그 한 후에

데이터 : EXAMPLE.TREAT   /   종속변수 : gain   /   설명변수 : diet

로 설정하면 다음과 같은 코드가 형성됨을 확인할 수 있습니다.

 

EXAMPLE.TREAT 데이터는 A,B,C 세 종류의 식이요법의 효과를 비교하기 위한 실험에서 얻은 데이터입니다. 

12명의 건강상태가 비슷한 회복기의 환자를 랜덤하게 3그룹으로 나누고, 일정기간 동안 각각에 A, B, C의 

식이요법을 시행하여 다음과 같은 체중증가 자료를 얻었습니다.

식이요법의 방법에 따라 체중증가에 차이가 있는지를 확인하는 것이 저의 목표입니다.

 


 

옵션탭으로 들어가 보면 분산분석에서 적용할 수 있는 다양한 옵션이 있습니다.

사후평균비교 방법으로 저는 "Tukey" 를 설정한 후에 코드를 실행해 보았습니다.

 


 

유의수준 a를 0.05로 기준 설정 한 후에 결과를 해석해본다면,

모델의 유의확률이 0.0198로 유의수준 0.05보다 작기 때문에 

"식이요법의 방법에 따라 체중증가에 차이가 없다"라는 귀무가설을 기각 

-> 식이요법의 방법에 따라 체중증가에 차이가 있음을 확인할 수 있습니다.

 


 

옵션탭에서 설정한 대로 정규성 검정과, 분산의 동질성 검정 결과도 확인할 수 있습니다.

 

식이요법의 방법에 따라 체중증가에 차이가 있음을 확인할 수 있고, 이를 사후평균비교 해본다면

diet 변수 A-B와 B-C는 같지만, A-C는 차이가 있음을 확인할 수 있습니다.(A>C)

 

이번에는 일원분산분석이 아닌 이원분산분석을 한번 시행해보겠습니다.

 


 

SAS University에서는 이원분산분석 Task를 제공해주지 않습니다. 

당황하지 않고~ 작업 -> 통계량 -> 일원분산분석을 드래그 한 후에

데이터 : EXAMPLE.CORNYIELD   /   종속변수 : corn   /   설명변수 : soil

로 설정하면 다음과 같은 코드가 형성됨을 확인할 수 있습니다.

 

EXAMPLE.CORNYIELD 데이터는 3종류의 토양(soil)과 2종류의 비료(fertile)에 따라 옥수수를 실험재배하여 수확한 데이터입니다.

토양의 종류, 비료의 종류, 토양과 비료의 상호작용에 따라 옥수수 수확량에 차이가 있는지를 알아보고자 하는 것이 저의 목표입니다. 

이를 위해서 아래와 같이 코드를 추가적으로 작성해야만 합니다.

 


 

추가적으로 코드를 작성하기 위해서는 대화식 모드를 종료해야만 합니다.

코드를 수정한 후에 실행해보면 아래와 같은 결과가 나옵니다.

 


 

유의수준 a를 0.05로 기준 설정 한 후에 결과를 해석해본다면,

모델의 유의확률이 0.0003으로써 유의수준 0.05보다 작기 때문에 모형이 유의함을 알 수 있습니다.

 

"토양(soil)의 차이에 따른 옥수수 수확량의 차이는 없다" 라는 귀무가설을 기각 / (유의확률이 <0.0001이기 때문에)

-> 토양에 따른 옥수수 수확량은 차이가 있음을 확인할 수 있습니다.

마찬가지 방법으로 비료(fertil)의 효과와, 교호작용(soil*fertil)의 효과 또한 확인할 수 있습니다.

둘 다 유의확률이 유의수준보다 크기 때문에 귀무가설 기각 실패

-> 비료에 따른 옥수수 수확량은 차이가 없다.

-> 토양과 비료의 교호작용에 따른 옥수수 수확량은 차이가 없다.

라는 결과를 도출해 낼 수 있습니다.

 


 

사후평균비교 해본다면 

soil 변수 3-1은 같지만 2-3은 같지 않음을 확인할 수 있습니다.(2>3=1)

 

지금까지 분산분석에 대해서 살펴보았습니다.

 

이것으로 "SAS University Edition 시작하기"를 마치겠습니다.


SAS University Edition의 가장 큰 3가지 장점은 다음과 같습니다.

 

1) 무료로 이용할 수 있음 

2) 직관적인 UI 환경으로써 쉽게 사용할 수 있음

3) SAS 코드를 제공

 

이를 통해서 제가 느끼는 SAS University Edition의 가치는

SAS를 사용하고자 하지만 코드 작성에 어려움을 겪는 분들이 

쉽게 SAS에 접근할 수 있도록 도와줄 수 있다는 점입니다.

그렇기 때문에 제가 SAS University Edition 활용법에 대해서 연재해보았습니다. 


기타 궁금하신 점이 있으시다면

언제든지 저에게 쪽지 or 댓글로 문의해주시면 친절하게 답변해드리겠습니다.

감사합니다.   

 

 

 
 
    
 
 아마존 웹 서비스를 이용한 SAS University Edition 이용 방법
 SAS University Edition 시작하기 (12) : 회귀분석