사이트맵  |  Contact Us
 
홈 > SAS Tech & Tip > SAS Enterprise Miner
Enterprise Miner를 이용한 Cluster Analysis (4) 2019.01.29
전보배 85 0
http://www.mysas.co.kr/SAS_tiptech/j_eminer.asp?b_no=11019&gotopage=1&con=subject&keyword=&cmd=content&bd_no=29&gubun=

안녕하십니까, 전보배 입니다.

지난 작업을 열어볼까요?

 

[그림 4-1]


 

변수 변환까지 작업이 돼 있지요?

 

필터링

클러스터링은 이상치들에 의해 결과가 많이 달라지므로걸러줄 필요가 있습니다.

 

[그림 4-2]


 

다이어그램 위의 툴바에서 [표본추출] 탭의 [필터링] 아이콘을 클릭해서 쭉~ 끌어다가 다이어그램의 [변수 변환] 노드 옆에 살포시 놓습니다. 저번처럼 [변수 변환] 노드 우측에서 마우스 포인터가 펜 모양으로 바뀌면 쓱- 이어서 [필터링] 노드에 놓습니다.

 

[그림 4-3]


 

[그림 4-3]과 같이 만드셨나요?

[그림 4-4]


 

[그림 4-4]과 같이 다이어그램 좌측 속성 패널에서 [Interval 변수] 옆의 […] 버튼을 클릭 하여 필터링 작업을 하겠습니다.

 

[그림 4-5]


 

저희는 “LOG_H_INCOME”을 수정하려고 합니다.

잠깐 지난 시간으로 돌아가서, 변수변환을 했던 변수들 중에 아래 [그림 4-6]과 같이 “LOG_H_INCOME” 의 분포만 정규분포에서 벗어나 있었습니다. (변수 변환 작업에서 볼 수 있는 그래프 입니다.)

 

[그림 4-6]


 

그래서 상한과 하한을 제한해서 필터링 해주려고 합니다.

 

[그림 4-7]


 

대화식 [Interval 필터]창에서 “LOG_H_INCOME” 변수를 선택 하시고 필터링 하한과 상한을 각각 “15”, “20”으로 적겠습니다.

좌측 하단의 [요약 생성] 버튼을 클릭하시면 해당 그래프도 확인하실 수 있습니다.

 

[그림 4-8]


 

이제 [확인] 버튼을 누르겠습니다.

[그림 4-9]


 

필터링 노드를 우클릭 후 [실행]을 선택합니다.

[결과]를 확인 하겠습니다.

 

[그림 4-10]


 

우측 상단의 [출력]창 스크롤을 조금 내리시면 [관측치 수] 부분에 필터에 의해 제외된 데이터가 229개 임을 확인 할 수 있습니다.

물론, 이런 필터링에 대한 의사 결정은 여러분들이 자유롭게 하실 수 있습니다. 모델링 과정을 만들어 놓고, 각 노드의 조건들을 수정해가며 더 좋은 모델을 찾으시면 됩니다.

 

다음 시간에는 드디어 클러스터링을 해보려고 합니다.

 

감사합니다.

 

오늘까지 작업한 emp를 다운로드 하실 수 있습니다.
저는 SAS Enterprise Miner 14.1, Local 환경에서 작업했습니다.
하위 버전이거나서버환경 일 경우 실행이 되지 않으실 수 있으니 참고 바랍니다.
물론 같은 버전같은 환경이어도라이브러리 디렉토리(D:\TEMP\DMR_전략팀)가 다르면 실행되지 않습니다.

 

참조 : [Business Analytics Using SAS Enterprise Guide and SAS Enterprise Miner: A Beginner's Guide]  

 
  dmr_customer_base_kr[9].sas7bdat
project[4].emp
 
휴대폰 번호
휴대폰 인증번호
 
 Enterprise Miner를 이용한 Cluster Analysis (5)
 Enterprise Miner를 이용한 Cluster Analysis (3)