사이트맵  |  Contact Us
 
홈 > SAS Tech & Tip > SAS Enterprise Guide
Enterprise Guide를 이용한 Business Analytics (5) 2018.11.04
전보배 61 0
http://www.mysas.co.kr/sas_tiptech/i_eg.asp?b_no=10998&cmd=content&bd_no=28

저번 시간 EG의 기능 중 데이터 특성화를 통해, 가지고 있는 data set의 변수들의 특성들을 대략적으로 살펴보았습니다.

 

이번 시간과 다음 시간에는수익에 의하여 고객을 분류한 후 고수익 고객과 나머지 고객의 특성을 비교해 보도록 하려고 합니다.

 

고수익의 기준이 어디인지 찾아야겠지요?

 

그래서 우리가 가지고 있는 data에서 수익의 백분률을 보고 어느 지점이 의미가 있는지 찾으려고 합니다. 물론, 여러분이 지금 현역에 계시다면 이미 통용되는 기준이 있으니 먼저 알아보고 작업하셔야 헛된 고생을 피하실 수 있습니다. ^^

 

, 다시 EGP 파일을 열어보세요.

오늘은 라이브러리 생성 부분만 실행해 볼까요? (라이브러리 할당 아이콘 우클릭 후 실행 or 아이콘 클릭 후 [F3])

이미 data set은 다 만들어 놨으니, data set 이 들어있는 디렉토리만 라이브러리로 다시 설정해주시면 됩니다.

 

매번 이렇게 라이브러리를 잡는 것이 귀찮으시다면, EG를 열 때, 자동으로 라이브러리를 설정하는 방법이 있습니다. 마지막 부분에 다시 설명 드릴게요.

 

먼저, 오늘의 할 일을 끝내보죠!

 

 

1. 분포분석

분포분석을 통해 수익을 분석하겠습니다.

[작업 공간]에서 [그림 5-1]과 같이 가져온 데이터, , “DMR_ST. DMR_CUSTOMER_BASE_KR”를 선택 합니다.

 

[그림 5-1]


 

그리고, [메뉴 > 도구 > 설명 > 분포분석]을 클릭한 다음 [그림 5-2]과 같이 수익성칼럼을 쭉~ 끌어다가 오른쪽 분석변수에 할당해줍니다. (혹시나 사족을 달면… “수익성은 레이블이고, 실제 칼럼명은 “CUSTOMER_REVENUE” 입니다.)

 

[그림 5-2]


 

왼쪽 패널에서 [테이블]을 선택하시면 아래 [그림]과 같은 창을 보실 수 있습니다. 체크 박스 중에 [분위수]를 체크하시면, 결과 리포트에서 수익성칼럼의 분위수를 보실 수 있습니다.

[실행]을 클릭하세요.

 

[그림 5-3]


 

[5-1]

분위수(정의 5)

레벨

분위수

100% 최댓값

1248000

99%

312000

95%

216000

90%

168000

75% Q3

120000

50% 중위수

72000

25% Q1

36000

10%

18000

5%

18000

1%

18000

0% 최솟값

18000

 

결과를 보면 75 퍼센타일, 3분위수가 120,000원 인 것을 볼 수 있습니다.

 

업무적으로 여러 가지 판단을 할 수 있지만, 오늘은 이 부분을 고수익과 아닌 것으로 나누는 기준으로 삼으려고 합니다.

 

2. 새로운 칼럼 생성 (질의빌더)

“상위 25% 이냐, 아니냐를 구분하는 칼럼을 하나 생성해서 이 칼럼을 기준으로 통계량을 살펴보면 우리가 기준을 잘 잡았는지 확인할 수 있겠죠?

 

그러면, 먼저 “TOP_25”라는 기준 칼럼을 만들어 보겠습니다.

 

드디어, 그 유명한 [질의빌더]를 열어 보겠습니다.

[질의빌더]에서는 새로운 칼럼 생성, 테이블 간의 조인, 필터링, 정렬 등의 다양한 작업을 할 수 있습니다. 그래서 실제 작업을 하실 때 가장 많이 쓰시는 메뉴이기도 합니다.

작업 공간에서 “DMR_ST. DMR_CUSTOMER_BASE_KR”를 선택 후 [우클릭 > 질의빌더]로 들어 가셔도 되고, [메뉴바 > 작업 > 데이터 > 질의빌더]를 통해 들어가셔도 됩니다.

 

데이터 선택 창에 출력하고자 하는 칼럼을 넣으면 되는데, 우리는 모두 선택해 보겠습니다.

제일 위에 있는 칼럼을 선택하고 shift키를 클릭한 후 가장 아래에 있는 칼럼을 선택하면 전체 칼럼이 선택이 됩니다.

 

[그림 5-4]


 

[질의빌더] 창 우측에 파란색 계산기 모양의 [새로운 칼럼 계산하기]를 누릅니다.

 

[그림 5-5]


 

저희는 [고급 표현식]을 선택해 보겠습니다. [다음] 버튼을 누릅니다.

 

[그림 5-6]


 

[표현식 입력창][그림 5-6] 같이 case when t1.CUSTOMER_REVENUE >= 12000 then 1 else 0 end라고 입력합니다. 여기에서 t1.CUSTOMER_REVENUE” 부분은 직접 타이핑 하지 않고 우측 아래 박스 안의 칼럼 수익성을 더블 클릭하면 자동으로 불러옵니다.

비록 짧은 코딩이지만, 여러분이 직접 타이핑을 하는 부분이므로 점 하나, 빈칸 하나 차이에 오류가 날 수 있으니 주의 깊게 작업 하시기 바랍니다.

 

[그림 5-7]


 

칼럼 이름은 “TOP_25” (대소문자 구분 없음)으로 적겠습니다. [마침] 버튼을 누르시기 바랍니다.

만약, 에러 창이 나타났다면, [그림]과 같이 “TOP_25”를 더블 클릭 하신 후 [편집] 버튼을 눌러 수정 하실 수 있습니다.

 

[그림 5-8]


 

결과 테이블은 아래와 같습니다.

 

[그림 5-9]


 

다음 시간에는 이 data set을 가지고 요약통계량, 테이블분석, correlation분석을 통해 우리가 설정한 TOP_25를 기준으로 고객의 특성을 비교해 보도록 하겠습니다.

 

 

 

3. EG 열 때, 자동으로 라이브러리 잡기


앞에서 말씀 드렸듯이, EG를 열 때 자동으로 라이브러리를 잡는 방법을 알려드리겠습니다.

[메뉴바 > 도구 > 옵션]에 들어가 왼쪽 패널에서 [SAS 프로그램]을 선택합니다.

 

[그림 5-10]


 

중간에 [서버가 연결될 때 SAS 코드 실행]을 체크하고, 오른쪽 [편집] 버튼을 누릅니다.

 

[그림 5-11]


 

편집 창에 위와 같이 라이브러리를 설정하는 코드를 삽입합니다. ([라이브러리 할당 아이콘 우클릭 > 열기 > 마지막 실행 코드 열기]에서 복사 후 붙여 넣기 하시면 됩니다.)

[저장] 버튼을 누르신 후 [확인] 버튼을 누르시면 옵션 적용이 됩니다.

그럼, 확인 차 새로운 EG를 열어볼까요? 새로운 EG를 연 후 서버리스트에서 라이브러리를 확인 하시면, “DMR_ST”가 바로 생성되어 있는 것을 보실 수 있습니다.

 

오늘까지 작업한 EGP를 다운로드 하실 수 있습니다.
저는 SAS Enterprise Guide 7.1, Local 환경에서 작업했습니다.
하위 버전이거나서버환경 일 경우 실행이 되지 않으실 수 있으니 참고 바랍니다.
물론 같은 버전같은 환경이어도라이브러리 디렉토리(D:\TEMP\DMR_전략팀)가 다르거나 불러오기 파일 위치(D:\Trea_SYSOP\Enterprise Guide를 이용한 Business Analytics)가 다르면 실행되지 않습니다.

 

참조 : [Business Analytics Using SAS Enterprise Guide and SAS Enterprise Miner: A Beginner's Guide]  

 
  DMR.egp
dmr_customer_base_kr.sas7bdat
다운로드 수 | 9
 
휴대폰 번호
휴대폰 인증번호
 

 더 이상 글이 존재하지 않습니다.

 [강좌]시각화 분석 통한 인사이트 찾기(2) - SAS 비주얼 애널리틱스 리포트 디자인