로그인   |  회원가입  |  사이트맵  |  Contact Us
  아이디 저장하기
 
홈 > 참여마당 > 나만의 SAS활용 노하우
데이터 전처리가 분석 결과 좌우한다 2017.11.02
조정윤 256 0
http://www.mysas.co.kr/SAS_club/d_freeboard.asp?b_no=7509&gotopage=1&con=subject&keyword=&cmd=content&bd_no=04&gubun=

출처: 아이티데일리 http://www.itdaily.kr/news/articleView.html?idxno=85775

 

분석을 위한 기본


쓰레기를 넣으면 쓰레기가 나온다(garbage in, garbage out)는 것은 데이터 분석의 기본 전제다. 올바른 분석 결과를 얻기 위해서는 올바른 데이터를 입력해야하므로, 우수한 분석 알고리즘을 설계하는 것만큼이나 충분히 가다듬어진 데이터를 확보하는 것이 중요하다. 고도의 분석 기술과 올바른 절차를 따르더라도 정제된 데이터가 확보되지 않으면 왜곡된 분석결과가 나올 수 있으며, 이는 데이터 분석에 대한 신뢰도를 떨어트림과 동시에 잘못된 의사결정을 유도함으로써 경제적·사회적 비용을 발생시킬 수 있다


<중략 >


데이터 분석을 위해서는 그에 적합한 데이터가 필요하며, 이를 확보하기 위해서는 충분한 데이터 전처리(Data Preparation) 과정이 필수적이다. 그러나 국내에서는 데이터 전처리를 데이터 분석 과정의 일부로 여길 뿐, 별도의 기술과 솔루션이 필요하다는 점에 대해서는 인식이 부족한 실정이다. 분석을 위한 기본 DB 잘 만들어도 전처리는 필수 비즈니스 조직의 ‘셀프서비스’ SAS 역시 셀프서비스 빅데이터 전처리를 자사 솔루션의 중요한 기능 중 하나로 언급하고 있다. 데이터 전처리는 분석의 연장선 필요성에 대한 인식 제고돼야 셀프서비스 BI툴을 활용해 비즈니스 조직이 직접 데이터 전처리를 수행하고 필요한 정보를 생산하든, IT 조직이 보다 효율적인 통합 BI 솔루션을 활용하거나 비즈니스 현황에 대한 이해를 넓혀 비즈니스 조직과의 마찰을 줄이든, 데이터 전처리와 관련한 역량 낭비는 해결돼야 할 문제임이 틀림없다. 국내 IT 기업들이 데이터 전처리에 대한 인식을 제고하고 이를 위한 논의를 진행해야 할 시점이다.   <중략>

 

 
 
    
 
 "AI 열풍 믿지 않지만, 15년 전부터 분석 기술에 적용"SAS 설립자 짐 굿나잇
 바젤 ‘시장 리스크 자기자본 규제’ , 시스템 구축 대응은 어떻게?