사이트맵  |  Contact Us
 
홈 > SAS Stories > SAS 활용 노하우
SAS VDMML 시작하기(2) 결측값 처리 2019.05.15
강지선 289 0
http://www.mysas.co.kr/SAS_Club/d_freeboard.asp?b_no=11102&cmd=content&bd_no=4

안녕하세요 MYSAS 시샵 입니다.

이번 시간에는 VDMMLvisual pipeline을 통해서 결측값을 처리하는 방법에 대해 알아보겠습니다. 

 

 

 

저번 시간에 설명한 데이터 설정 단계를 지나면 파이프라인을 볼 수 있습니다.

[ 데이터 마이닝 사전 처리 ]에는 데이터를 정제에 대한 기능들이 있습니다.

 

 

 

 

 

 

 

 


 

왼쪽에서 원하는 기능을 파이프라인 화면으로 가져오면 됩니다. 파이프라인에서 원하는 부분으로 기능을 가져오면 자동적으로 파이프라인이 생성되기 때문에 쉽게 분석을 진행할 수 있습니다.

각 단계는 기본적인 default값으로 설정되어 있습니다. 설정을 바꾸고 싶을 땐, 노드를 클릭하게 되면 화면 오른쪽에 나타납니다. 






여러 사전 처리 중에서 가장 기본적이면서도 중요한 결측값 처리를 해보겠습니다.




class입력변수와 interval입력변수의 결측값을 각각 다른 방법으로 처리할 수 있습니다.



단일표시자와 고유표시자를 설정할 수 있는데, 이 옵션은 결측값이 의미가 있을 경우 선택해주면 됩니다. 단일표시자는 모든 입력변수에 대해 결측값이 존재하는지를 표시해주고, 고유표시자는 각 변수에 대해 결측값이 존재하는지 나타내줍니다.

결과를 보면


 

결측값 처리를 한 변수는 ‘IMP_변수명으로 생성되었고, 결측임을 나타내는 표시자 변수는 ‘M_변수명으로 생성되었습니다. 전체 변수에 대한 표시자 변수는 ‘M_VARIABLE’로 설정되었습니다.

 

 

 

파이프라인을 눈으로 확인하면서 데이터를 정제를 쉽게 할 수 있다는 것이 큰 장점입니다~ 

 

 

 
 
휴대폰 번호
휴대폰 인증번호
 
 SAS VDMML 시작하기 (3)템플릿을 사용한 머신러닝
 SAS VDMML 시작하기(1)