로그인   |  회원가입  |  사이트맵  |  Contact Us
  아이디 저장하기
 
홈 > SAS Tech & Tip > 쉬운 SAS, SAS EG
[Excel보다 쉬운 SAS, SAS EG 따라잡기]28. 범주형 자료분석(로지스틱 회귀분석) 2013.01.30
MYSAS 8932 0
http://www.mysas.co.kr/SAS_tiptech/i_eg.asp?b_no=2494&gotopage=1&con=subject&keyword=&cmd=content&bd_no=28&gubun=

 

Lesson28. 범주형 자료분석(로지스틱 회귀분석)

*관련 메뉴 : 작업 – 분석 – 회귀 – 로지스틱 회귀 

*Dataset: http://www.ilr.cornell.edu/~hadi/RABE4/Data4/P322.txt

 

  들어가는 말

 

 안녕하세요. MYSAS 입니다. 오늘은 [범주형 자료분석]에서 중요한 부분을 차지하고 있는 [로지스틱 회귀분석]을 배워 보겠습니다. Enterprise Miner과정에서도 중요한 Model이므로 유심히 봐주었으면 좋겠습니다.

 

  Lesson

 

  

 

  로지스틱 회귀분석

 

 회귀분석은 하나의 종속변수와 하나 이상의 설명변수 간의 인과관계를 분석하는 방법입니다. Lesson27을 참고하면 종속변수가 범주형일 경우 로지스틱 회귀분석 모형을 사용합니다. 종속변수의 분류가 2개인 경우 이항 로지스틱 회귀모형이라고 불리고, 그 이상인 경우 다항 로지스틱 회귀모형입니다. 여기서는 가장 많이 사용되는 이항 로지스틱 회귀모형을 설명하겠습니다.

Dataset의 형태

Y 변수(종속변수: 이분형)와 X1~X3(설명변수)의 관계를 분석하겠습니다.

1단계: 로지스틱 회귀 선택


2단계: 데이터 선택(종속변수: Y, 설명변수: x1, x2, x3)

1) 종속변수: 종속변수로 사용할 변수를 지정
2) 양적변수: 설명변수로 연속형(수치형) 변수를 지정
3) 분류변수: 설명변수로 범주형 변수를 지정

3_1단계: 모형_반응(반응 유형: 이진 / 모형 유형: 로짓)


3_2단계: 모형_효과(주효과: X1, X2, X3)


3_3단계: 모형_선택(단계별 선택)


3_4단계: 모형_옵션_조건부 오즈비(왈드, 유의수준 0.05)


4단계: 결과

유의한 변수로는 X1만 선택되었습니다.

위 결과에 대해서 추가적으로 소개할 중요한 개념이 있습니다.
바로, Odds Ratio(오즈비)입니다. 수식으로 설명드리기 보다는 위 결과를 바탕으로 설명하겠습니다.

X1에 대한 Estimate: 0.838(exp(-0.1767)) 의 값은 다른 회귀계수가 존재하지 않기 때문에
X1이 한 단위 증가하게 되면 약 0.838배가 됩니다.

Odds Ratio에 대한 보충설명
만약 신뢰구간이 1를 포함한다면 유의하지 않는 오즈비로 판단할 수 있습니다.

만약 모든 설명변수가 존재시 해석하는 방법

유의한 변수가 없지만, X1을 기준으로 해석하겠습니다.
(앞에서 설명드린 Odds Ratio의 신뢰구간을 보면 모두 1를 포함하기 때문에 유의하지 않다고 판단이 됩니다.)

X1에 대한 Estimate: 0.718(exp(-0.3312)) 의 값은 X2와 X3를 고정시킨 상태에서  
X1이 한 단위 증가하게 되면 약 0.718배가 됩니다.

 

 

  차회 예고 > 다변량 자료분석(주성분 분석)

 


 

 

  QUIZ

 


 

 Lesson26. 정답

 

Q. 
Dataset: ex_1를 이용하여
종속변수: y
설명변수: Factor_A, Factor_B
이 있습니다. 유의수준(0.05) 기준으로 Factor_A와 Factor_B의 교호작용이 유의한지 하지 않은지 검정해 주세요.



그림으로 확인 시 교호작용이 있을 것으로 예상됩니다.

정확히 판단을 하기 위해 검정한 결과

Type1 과 Type3의 차이가 없습니다.
Factor_A*Factor_B 의 P-value: 0.0004 < 유의수준(0.05)
기각역에 포함되므로, 귀무가설(H0 = Factor_A*Factor_B 는 유의하지 않다.)을 기각합니다.
즉, Factor_A*Factor_B는 유의하다는 것을 알 수 있습니다.
 

 

 이번 회 QUIZ

 
Q. Dataset: SASHELP.CLASS를 이용하여
종속변수: Sex
양적변수: Age, Height, Weight
양적변수들은 주효과로만, 조건부 오즈비(왈드)로 설정하여 나머지 조건은 없이 실시합니다. 모형의 선택이 없기 때문에 Age, Height, Weight의 오즈비 값들이 다 나올 것으로 예상됩니다. Age, Height, Weight의 각각의 오즈비를 적어주세요.

예시답변)
X1의 오즈비: 0.718
X2의 오즈비: 0.835
X3의 오즈비: 0.006


쪽지 보내주세요~~소정의 상품이 있습니다!!
정답을 맞추신 분들중 추첨을 통해 10명에게
스타벅스 카페라떼 1잔씩 보내 드립니다. 많은 참여 부탁드립니다.
참고로 회원정보 수정에 가셔서 본인의 핸드폰이 맞는지 확인 한번 해주세요.
정답 발표 날 : 2013.02.04(월요일)


감사합니다.

  

MYSAS 올림.

 
 

 
 
    
MYSAS   [2013/01/31 5:51]
앞으로도 열심히 하겠습니다^^ 많은 응원 부탁드리겠습니다.
김동진   [2013/01/31 1:29]
처음 하는 사람도 쉽게 따라할 수 있게 써주신 메뉴얼 같은 느낌이라서 좋습니다. 좋은 글 감사합니다.
 
 [Excel보다 쉬운 SAS, SAS EG 따라잡기]29. 다변량 자료분석(주성분 분석)
 [Excel보다 쉬운 SAS, SAS EG 따라잡기]27. 범주형 자료분석(교차분석)