사이트맵  |  Contact Us
 
홈 > SAS Tech & Tip > SAS Enterprise Guide
[Excel보다 쉬운 SAS, SAS EG 따라잡기]20. 산점도, 레이더 그래프, 타일 그래프 2013.01.09
MYSAS 9848 0
http://www.mysas.co.kr/SAS_tiptech/i_eg.asp?b_no=2393&gotopage=5&con=subject&keyword=&cmd=content&bd_no=28&gubun=

 

Lesson20. 산점도, 레이더 그래프, 타일 그래프

*관련 메뉴 : 작업 – 그래프 – 산점도, 레이더 그래프, 타일 그래프

*Data Set : SASHELP.CARS(산점도, 레이더 그래프), SASHELP.CLASS(타일 그래프)

 

  들어가는 말

 

 안녕하세요. 오랜만에 찾아온 "Excel보다 쉬운 SAS, SAS EG 따라잡기"입니다. 계획했던 강의 목차및 많이 사용되는 통계분석방법에 대해서 MYSAS가 강의를 연재합니다. 오늘은 [산점도], [레이더 그래프]와 함께 [타일 그래프]를 배워보겠습니다. [산점도] 2개 또는 3개의 변수 간 관계를 알아보는데 유용합니다. [레이더 그래프]는 어떤 기준에 대하여 상대적인 빈도를 펼쳐놓은 모습이라고 생각하면 됩니다. [타일 그래프]는 트리로 표시되므로 웹과 같은 대화식 환경에서 특히 유용합니다. 중요도를 따지면 아무래도 산점도를 먼저 언급하고 싶습니다.

 

  Lesson

 

  

 

  1. 산점도

 

 SASHELP.CARS 데이터를 불러온 후 작업 창에 가도 되지만, 데이터 셋을 더블 클릭한 후 위 메뉴를 보면 [그래프]라는 항목을 확인할 수 있습니다. 

 

1단계 : 도표 유형 선택(일반적으로 2개의 변수의 관계 파악)

  

 

2단계 : 데이터(Length(가로) 및 Weight(세로)와의 관계를 파악)

  

 조금 더 자세히 알아보고 싶으면 [작업 역할]에 변수를 추가하여 볼 수 있습니다. 만약 Origin 그룹별로 보고 싶으면 Origin을 드래그해서 [그룹 분석 칼럼]에 넣으면 3가지의 그림(아시아, 유럽, 미국)이 나오는 것을 확인할 수 있습니다.

3단계 : 결과 그래프

  

 그래프를 보면 두 변수는 서로 양의 관계가 있다는 것을 알 수 있습니다. 이는 다음 강의에서 보여 드릴 귀무가설(두 변수는 연관성이 없다.)을 기각할 것으로 예측됩니다.
 

 

 2. 레이더 그래프

 

  산점도의 위치를 찾는 방법과 동일하게 진행합니다.

 

1단계 : 데이터(Type을 기준으로)

 만약 그룹 간의 상대적인 빈도 차이를 알고 싶으면 작업 역할의 [그룹 분석 칼럼], [중첩 칼럼], [수평 칼럼], [수직 칼럼]중 한 곳에 추가로 Origin 변수를 집어넣어 분석하게 되면 아시아, 유럽, 미국 간의 빈도 차이를 알 수 있습니다. 위 상태로 수행하게 된다면 Type에 대한 일원 빈도 분석 결과를 펼쳐 놓은 모형이 예상됩니다
.

2단계 : 결과 그래프

그래프의 결과를 보면 Sedan이 가장 상대적인 빈도가 높고 Hybrid가 가장 작다는 것, 그리고 이 그래프의 최대값은 262이라는 것을 알 수 있습니다. 이제 일원빈도분석표를 비교해보자. 다른 기준을 두지 않았으므로, 동일하게 나올 것으로 예상됩니다.


 

 

 

 3. 타일 그래프

 

  여기서는 다른 Data Set(SASHELP.CLASS)을 사용하겠습니다. 

산점도의 위치를 찾는 방법과 동일하게 진행합니다.


1단계 : 데이터
 여기서 주의해야 할 점은 분류변수의 순서에 따라 다른 그림이 나온다는 것을 파악해야 합니다. 변수 순서를 달리하여 결과 그래프를 두 가지의 모습으로 보여 드리도록 하겠습니다.


그림 1 Sex -> Age


그림 2 Age -> Sex

 결과 그래프에 앞서 크기분석 변수를 Weigth로 설정하면 그 부분에 속한 Weight의 합이 나타나게 됩니다.

2단계 : 결과 그래프

결과 : 그림 1 Sex -> Age


결과 : 그림 2 Age -> Sex


(성별 : 남, 나이 : 14) 몸무게의 합 215로 같다는 것을 알 수 있습니다.

지금까지 EG에 대한 기본적인 기능과 질의 빌더 및 그래프 모형을 파악했으니, 앞으로의 과정에서는 통계분석 중 꼭 필요한 분석들을 EG에서는 어떻게 할 수 있는지 알아보는 시간을 갖도록 하겠습니다. 질의 빌더 사용법을 잘 숙지하고 이를 최대한으로 활용할 수 있다면 데이터 가공 및 파생변수 생성이 가능하며 이를 통해 자신이 원하는 맞춤형 분석 Data Set 생성이 용이하다는 점을 기억하시면 좋으실 것 같습니다.

 

 

  차회 예고 - 기술> 통계적 추론(가설 검정, 유의 수준 등), T-검정(단일 검정)

 


 

 

  QUIZ

 


 

 돌아온 퀴즈!!!

 

Q. 산점도로는 분석 할 수 있는 변수의 수가 제한적입니다. 따라서 산점도 행렬로 분석하면 한 번에 많은 변수를 볼 수 있습니다. 이 Data Set에서 Weight와 Height는 양의 관계를 하고 있습니다. Weight와 음의 관계를 보이는 변수의 이름을 찾아주세요.
(Data Set : SASHELP.CARS 이용)

(EngineSize, Cylinders, Horsepower, MPG_City, MPG_Highway, Wheelbase, Length)

쪽지 보내주세요~~소정의 상품이 있습니다!!
정답 발표 날 : 2013.01.14(월요일)

다른 예제로 하나 보여 드리겠습니다.
Data Set : SASHELP.CLASS



해석 : 나이, 키, 몸무게는 서로 양의 상관관계를 보이는 것으로 예상됩니다.


감사합니다.

  

MYSAS 올림.

 
 

 
  cars.sas7bdat
class.sas7bdat
다운로드 수 | 41
김동진   [2013/01/10 1:01]
좋은 글 감사합니다~!
MYSAS   [2013/01/09 6:27]
쪽지 보내주세요~~소정의 상품이 있습니다!! 정답 발표 날 : 2013.01.14(월요일)
김현우   [2013/01/10 9:07]
좋은 글 감사합니다.^^
MYSAS   [2013/01/10 6:11]
쪽지 보내주세요~~~~정답을 맞추신 분들중 추첨을 통해 10명에게 스타벅스 카페라떼 1잔씩 보내드립니다. 많은 참여바랍니다.
휴대폰 번호
휴대폰 인증번호
 
 [Excel보다 쉬운 SAS, SAS EG 따라잡기]21. 통계적 추론(가설 검정, 유의 수준 등), t-검정(단일 검정)
 모수가 추정될 때 Pearson 적합도 검정