사이트맵  |  Contact Us
 
홈 > SAS Tech & Tip > SAS Programming
[SAS 프로그래밍] 데이터셋 옵션(Dataset Options) 활용하기 2018.01.08
김효범 550 0
http://www.mysas.co.kr/sas_tiptech/a_question.asp?b_no=7588&cmd=content&bd_no=5

 

 

 안녕하세요. 오늘은 DATASET OPTIONS(데이터셋 옵션)에 대해 알아보겠습니다. 데이터셋 옵션은 데이터 단계나 프로시져 단계에서 유용하게 사용될 수 있습니다. 자주 사용되는 옵션들은 다음과 같습니다.

 

 

KEEP= : 데이터셋에 포함될 변수들을 지정

DROP= :데이터셋에 포함되지 않을 변수들을 지정

RENAME=(oldname=newname) : 변수명을 변경

FIRST OBS=n : n번째 개체부터 데이터를 불러옴

OBS=n : n번째 개체까지만 데이터를 불러옴

 

 

 

 

Data Step

데이터셋에 포함될 변수와 포함시키지 않을 변수를 지정할 때 KEEP옵션과 DROP옵션이 사용됩니다. 예시에 사용될 데이터는 다음과 같습니다.

 



예시로 만든 두개의 데이터를 MERGE문을 통해 가로결합을 하는 과정에서 데이터셋 옵션을 사용해보겠습니다.

Test데이터셋에는 KEEP옵션을 사용하여 id, name, height 변수만을 OBS옵션으로 3번째 개체까지만  남겼습니다. Test_1데이터셋에는 DROP옵션을 사용하여 score 변수를 제거하고 RENAME옵션으로 dept변수명을 test로 변경한 것을 확인하였습니다.

 

 

데이터셋 옵션의 장점은 기존데이터셋을 변경하는 것이 아니라 새로운 데이터셋을 만들 때만 임시적으로 작동하는 것이기 때문에 기존데이터를 보존할 수 있다는 것입니다. 또한 반드시 데이터셋 옆에 함께 쓰이지않고도 독립적으로 사용할 수도 있습니다.

 

 

 

 

Procedure Step

프로시져 단계에서도 데이터셋 옵션을 사용할 수 있습니다.

Proc print문에 사용되는 dataset FIRSTOBS옵션을 사용하여 3번째 개체부터, DROP옵션을 사용하여 gender변수를 빼고 데이터를 읽어온 것을 확인 하였습니다.

 

 

 

 

마치며

오늘은 데이터 단계와 프로시져 단계에서 데이터셋을 불러올 때 사용할 수 있는 데이터셋 옵션에 대해 알아보았습니다. 독립적으로 사용할 수도 있긴 하지만 두개 이상의 데이터셋을 불러올 때는 편리하게 원하는 처리를 할 수 있는 장점이 있고 또한 원데이터를 보존하면서 진행하는 장점도 있습니다.

 

 

 

 

Reference

김기영 외 3. 『예제로 배우는 SAS프로그래밍 입문』. 자유아카데미. 2016.

 

 

 
 
 
휴대폰 번호
휴대폰 인증번호
 
 [Mixed Model 1.1] SAS Enterprise Guide 소개
 [SAS 프로그래밍] PROC RANK를 이용해 그룹별 top n을 검색하는 방법