로그인   |  회원가입  |  사이트맵  |  Contact Us
  아이디 저장하기
 
홈 > SAS Tech & Tip > 쉬운 SAS, SAS EG
[Excel보다 쉬운 SAS, SAS EG 따라잡기]30. 다변량 자료분석(요인 분석) 2013.02.04
MYSAS 5351 0
http://www.mysas.co.kr/SAS_tiptech/i_eg.asp?b_no=2513&gotopage=1&con=subject&keyword=&cmd=content&bd_no=28&gubun=

 

Lesson30. 다변량 자료분석(요인 분석)

*관련 메뉴 : 작업 – 분석 – 다변량 – 요인 분석 

*Dataset: EX, factor(개인적으로 만든 Dataset입니다.)

 

  들어가는 말

 

 안녕하세요. MYSAS 입니다. 오늘은 [다변량 자료분석]의 [요인 분석]을 배워 보겠습니다.
다소 어려운 개념이 많기 때문에 깊게 들어가지 않도록 하겠습니다.

 

  Lesson

 

  

 

  요인 분석(Factor Analysis)

 

 상호연관된 변수들간의 잠재요인이 있어 그것을 이용하여 변수의 개수보다 적은 수의 요인으로 묶어 이를 통해 분석하는 통계적 방법입니다. 약간 주성분분석과 비슷한 느낌을 받습니다.

주성분 분석과 요인 분석의 차이(MYSAS의 자유게시판 참고)
http://www.mysas.co.kr/SAS_club/d_freeboard.asp?b_no=2033&gotopage=1&con=subject&keyword=주성분분석&cmd=content&bd_no=04&gubun=

요인수의 결정
주로 사용되는 방법으로 Eigenvalue의 값이 1보다 큰 경우입니다.

Dataset: EX의 형태(국어, 영어, 제2외국어, 수학, 과학 변수: 100점 만점)


1단계: 요인분석 선택


2단계: 데이터 선택(분석변수: 국어, 영어, 제2외국어, 수학, 과학)


3단계: 요인화 방법(기본 설정)



4단계: 공통성(기본 설정)


5단계: 회전과 도표(No rotation)

회전 방법을 선택하는 이유는 Factor에 대한 해석이 어려움을 겪을 시 사용하게 됩니다. 주로 사용되는 회전 방법에 대한 추가적인 설명을 드리겠습니다.
1) 직교회전: Varimax - 요인간 독립적일 때

2) 사각회전: Promax - 요인간 상관관계가 존재할 때

6단계: 결과(필요시 선택)


4단계: 요인분석 결과

여기서 유심히 봐야 할 것은
Eigenvalues of the Correlation MatrixFactor Pattern 입니다.

1) Eigenvalues of the Correlation Matrix에 대한 해석
 추가적인 설정을 하지 않았으므로, 요인의 수는 앞서 설명을 드린 Eigenvalue > 1 보다 큰 경우에만 선택되므로 Factor1과 Factor2가 선택됩니다.
 (1) Factor1의 경우 설명 비율은 약 54%를 차지합니다.
 (2) Factor2의 경우 설명 비율은 약 33%를 차지합니다.
 따라서, 2개의 Factor를 사용한 경우 약 87%의 설명력을 가지게 됩니다.

2) Factor Pattern에 대한 해석
 각 Factor에 대한 계수 값을 보면 무엇을 의미 하는지 파악할 수 있습니다.
 (1) Factor1의 경우 크게 눈에 띄는 값이 존재하지 않고 골고루 퍼져 있기에 전반적인 
  과목의 능력을 나타나게 됩니다.
 (2) Factor2의 경우 국어, 영어, 제2외국어 와 수학, 과학으로 구분되는 것을 알 수 
  있습니다. 경험상 문과이과의 느낌인 것 같습니다.
 

 

  차회 예고 > 다변량 자료분석(군집 분석)

 


 

 

  QUIZ

 


 

 Lesson28. 정답

 

Q. 
SASHELP.CLASS 를 이용하여
종속변수: Sex
양적변수: Age, Height, Weight
양적변수들은 주효과로만, 조건부 오즈비(왈드)로 설정하여 나머지 조건 없이 실시합니다.
모형의 선택이 없기 때문에 Age, Height, Weight의 오즈비 값들이 다 나올 것으로 예상됩니다. 각각의 오즈비를 적어주세요.


Age: 0.171
Height: 1.164
Weight: 1.142

 

 

 이번 회 QUIZ

 
Q. Dataset: factor 를 이용하여
분석변수: x1 - x5
다른 추가 조건 없이 요인분석을 돌렸을 때, Eigenvalue > 1 경우에만 Factor로 쓰입니다. 몇 개의 Factor가 사용되고 모두 사용되었을 때 설명비율은 약 얼마나 되는지 적어주세요.

Dataset: factor의 형태


예시답변)
Eigenvalue > 1 보다 큰 경우에만 선택되므로 Factor1과 Factor2가 선택됩니다.
1) Factor1의 경우 설명 비율: 약 54%
2) Factor2의 경우 설명 비율: 약 33%
따라서, 2개의 Factor를 사용한 경우 약 87%의 설명력을 가지게 됩니다.


쪽지 보내주세요~~소정의 상품이 있습니다!!
정답을 맞추신 분들중 추첨을 통해 10명에게
스타벅스 카페라떼 1잔씩 보내 드립니다. 많은 참여 부탁드립니다.
참고로 회원정보 수정에 가셔서 본인의 핸드폰이 맞는지 확인 한번 해주세요.
정답 발표 날 : 2013.02.13(수요일)


감사합니다.

  

MYSAS 올림.

 
 

 
  ex[3].sas7bdat
factor.sas7bdat
다운로드 수 | 31
    
김현우   [2013/02/05 9:38]
좋은 강의 감사합니다^^
 
 [Excel보다 쉬운 SAS, SAS EG 따라잡기]31. 다변량 자료분석(군집분석)
 [Excel보다 쉬운 SAS, SAS EG 따라잡기]29. 다변량 자료분석(주성분 분석)