사이트맵  |  Contact Us
 
홈 > SAS Tech & Tip > SAS University Edition
[SAS University Edition] 다중선형회귀분석(Multiple Linear Regression) 2019.02.15
서민석 207 0
http://www.mysas.co.kr/sas_tiptech/d_university_edition.asp?b_no=11028&gotopage=1&con=subject&keyword=&cmd=content&bd_no=36&gubun=

 이번 시간에는 다수의 설명변수가 종속변수와 연관되어 있을 경우에 수행하는 다중선형회귀분석(Multiple Linear Regression)에 대하여 알아보겠습니다. 사용할 데이터셋은 icecream데이터셋으로 가격과 온도가 어떻게 아이스크림의 소비량에 어떤 영향을 끼치는지 알기 위해 수집된 데이터입니다. 우리의 목표는 아이스크림의 소비량이 다른 두 변수에 의해 어떤 영향을 받는지 알아보는데 적절한 통계적 모델을 적합시키는 것 입니다.

 


<그림 1>

 

 먼저 세 변수 모두 연속형 변수라는 것을 그림 1을 통해 확인할 수 있습니다. 본격적인 모델링에 앞서 종속변수에 해당하는 소비량과 다른 두 변수 사이의 산점도를 통해 상관관계를 확인합니다. 아래의 절차를 통해 SASStudio에서 산점도를 그릴 수 있습니다.

 

1. 작업 그래프 산점도

2. 데이터 sasue.icecream 테이블 선택

3. 역할 consumptiony변수로 지정 pricex변수로 지정

4. 실행 클릭

5. temperaturex변수로 지정하여 반복 

 


 

<그림 2>

 

 


 

 

<그림 3>

 

 

 산점도를 통해 가격보다는 온도가 소비량 과 선형적인 연관성이 높은 것으로 보여집니다. 온도가 올라갈수록 아이스크림 소비량이 증가하는 경향이 존재함을 알 수 있습니다.

 

다중선형회귀분석(Multiple Linear Regression)


 우리는 이미 하나의 설명변수가 종속변수에 미치는 영향을 알아보기위한 모델인 단순선형회귀(Simple Linear Regression)을 공부했습니다. 다중선형회귀는 단순선형회귀에서 확장하여 설명변수가 다수일 경우 사용하는 모형입니다. 수하적으로 다음과 같이 표현됩니다. 

 


 

 

 



1. 작업 통계량 선형회귀

2. 데이터 sasue.resting 테이블 선택

3. 역할 consumption종속변수로 지정 pricetemperature 연속형 변수로 지정

4. 모델 모델 효과에 pricetemperature 추가

5. 실행 클릭


<그림4>

 그림 4의 결과표를 해석해보겠습니다. 먼저 분산분석표의 F-test 결과를 보면 아주 작은 유의확률을 가지는 것을 알 수 있습니다. 이는 두 회귀계수 모두 0 이라는 귀무가설을 기각하고. 종속변수와 설명변수들사이에 회귀관계가 존재한다고 결론지을 수 있습니다. 하지만 회귀관계가 존재한다는 것이 그것을 사용함으로써 효율적인 예측을 할 수 있음을 보장하지는 않습니다. R-square을 보면 약 0.63으로 두 설명변수의 변동에 의해 종속변수의 변동량의 63%정도가 설명된다고 해석할 수 있습니다. 추정된 회귀계수를 보면 가격의 경우 음의 값을 갖는 것을 알 수 있습니다. 이것은 온도가 고정되어 있을 때 가격이 증가할수록 소비량이 감소함을 의미합니다. 그러나 앞서 그려봤던 두 산점도의 결과를 종합해봤을 때 추정된 회귀계수들 중 온도의 경우만이 통계적으로 유의할 것이라고 결론지을 수 있습니다. 회귀계수 값은 0.00303으로 온도가 한 단위 증가할 대 소비량이 0.00303만큼 증가하는 것을 알 수 있습니다.

 

 이번 시간에는 다중선형회귀분석에 대하여 알아보고 예제 데이터에 모형을 적합해보았습니다. 감사합니다.

 

Reference

도서 – Essential Statistics Using SAS University Edition / Der, Geoff, Everitt, Brian S. / SASInstitute

 

 

 

 
 
  [2019/05/12 3:58]
다중공선성을 보려고 하는데 옵션을 /vif collinoint 주어도 vif 값이 안 나오네요... 다중공선성 보는 방법 좀 알려주세요~
휴대폰 번호
휴대폰 인증번호
 
 [SAS University Edition] 다중선형회귀분석(2) (Multiple Linear Regression)
 [SAS University Edition] 잔차 분석