로그인   |  회원가입  |  사이트맵  |  Contact Us
  아이디 저장하기
 
홈 > SAS Tech & Tip > 쉬운 SAS, SAS EG
[Excel보다 쉬운 SAS, SAS EG 따라잡기]마치면서... 2013.02.13
MYSAS 3717 0
http://www.mysas.co.kr/SAS_tiptech/i_eg.asp?b_no=2566&gotopage=1&con=subject&keyword=&cmd=content&bd_no=28&gubun=

     

  들어가는 말

 

 안녕하세요. MYSAS 입니다. 오늘은 다변량 자료분석(요인분석, 군집분석, 판별분석) 퀴즈 발표 및 마지막 Tip을 드리면서 아쉽지만 "Excel보다 쉬운 SAS, SAS EG 따라잡기"강의를 마무리하겠습니다..

 

  QUIZ

 

  

 

  Lesson30. 다변량 자료분석(요인분석)

 

Q. Dataset: factor를 이용하여
분석변수: x1 - x5
다른 추가 조건 없이 요인분석을 돌렸을 때, Eigenvalue > 1 경우에만 Factor로 쓰입니다. 몇 개의 Factor가 사용되고 모두 사용되었을 때 설명비율은 약 얼마나 되는지 적어주세요.

Dataset: factor의 형태



Eigenvalue > 1 보다 큰 경우에만 선택되므로 Factor1Factor2가 선택됩니다.
1) Factor1의 경우 설명 비율: 약 55.5%
2) Factor2의 경우 설명 비율: 약 28.65%
따라서, 2개의 Factor를 사용한 경우 약 84.15%의 설명력을 가지게 됩니다.

 

  Lesson31. 다변량 자료분석(군집분석)

 
Q. SASHELP.CLASS를 이용하여
계층적 군집분석(Ward의 최소분산법)을 통해 메리와 처음으로 연결되는 이름을 적어주세요.

분석변수: Age, Height, Weight
레이블 식별: Name




윌리엄 입니다.

 

  Lesson_Final. 다변량 자료분석(판별분석)

 
Q. SASHELP.CARS를 이용하여

데이터는 아래와 같이 설정 후,

옵션은 아래와 같이 설정 후,


Error Count Estimates for Origin에 대해서 적어주세요.

Rate: Asia 0.3269 Europe 0.2114 USA 0.2857 Total 0.2793
Priors: Asia 0.3662 Europe 0.2887 USA 0.3451

 
 

 

  마지막 Tip

 

 아시는 분도 계시겠지만, 모르시는 분이 있다는
가정하에 프로세스 플로우의 Tip을 드리겠습니다.

프로세스 플로우는 하나 이상의 개체로 구성되며 프로세스 트리를 포함할 수 있습니다. 쉽게 설명을 드리면 하나의 작업공간이라고 생각하면 됩니다.

 Enterprise Guide를 처음 사용 하시는 분들은 대부분 하나의 작업공간에 모든 분석 내용을 집어넣는 경우가 많습니다.

이런 경우는 어떤 Dataset을 이용하고 어떤 분석을 이용했는지 분석을 했던 사람을 제외하고는 제대로 이해하기 힘듭니다. 이를 보완하기 위해서 프로세스 플로우의 Tip을 드리고자 합니다.

 다들 아시겠지만, SAS의 경우 프로그램 실행 시 순차적으로 진행됩니다. 프로세스 플로우 경우도 마찬가지 입니다. 이러한 성질을 알고 있다면 앞으로 설명드릴 Tip에 대해서 빠르게 이해할 수 있을 것입니다. 작업공간도 마찬가지 입니다.

프로세스 플로우의 이름을 변경(프로세스 클릭 후 오른쪽 클릭)하여, 어떤 작업공간인지 단번에 알아볼 수 있도록 하는 편이 좋습니다.

"SAS마이닝 챔피언십" 모 팀의 분석 예제를 변형하여 일부만 보여드리겠습니다.

총 10개의 프로세스 플로우가 있습니다.
각각의 이름은 처음 보는 사람도 알기 쉽게 변형했습니다.

여기서는 10개의 프로세스 플로우 중 일부만 보여드리겠습니다.

라이브러리 할당
분석에 필요한 각종 Dataset을 가져오기 위해서 입니다.


사전작업_1. 지역 결측치 변환
각종 작업을 실행한 경우 이름을 변경하여 어떤 작업을 했는지 알 수 있도록 합니다. 추가로 프로그램을 돌리면서 EG와 연동되는 것을 볼 수 있습니다.


사전작업_2. Data Cleansing & JOIN


EDA


위와 같이 작업공간을 세분화하며, 각종 작업에 대해 이름을 변경하면서 진행한다면, 처음에는 속도가 느려도, 분석이 끝나고 다시 분석과정을 검토할 때는 정확하고 빠르게 파악할 수 있습니다. "Excel보다 쉬운 SAS, SAS EG 따라잡기"에서 드리는 MYSAS만의 노하우(?)가 담긴 Tip입니다.

 

  맺음말

 


그 동안 부족한 강의를 따라와주신 여러분께 감사의 말씀을 드립니다.
앞으로 더 좋은 강의를 가지고 찾아 뵙겠습니다.




감사합니다.

  

MYSAS 올림.

 
 

 
 
    
김동진   [2013/02/13 7:46]
마지막 팁에서 EG만의 장점을 알게되서 좋네요~ 수고하셨습니다!
김준홍   [2013/07/12 8:59]
감사합니다 ^^
백승민   [2013/02/13 6:32]
정말 수고 많이 하셨네요. 앞으로도 좋은 강의를 기대하겠습니다..^^
구자현   [2013/02/14 4:55]
수고하셨습니다 ~~
MYSAS   [2013/02/14 9:27]
감사합니다^^
김현우   [2013/02/15 11:34]
수고하셨습니다^^
강승구   [2013/07/10 9:58]
감사합니다 ^^
 
 Enterprise Guide에서 “메모 노트” 활용 하는 방법
 [Excel보다 쉬운 SAS, SAS EG 따라잡기]Final. 다변량 자료분석(판별분석)