기자명 허옥엽 기자 (oyheo14@skkuw.com)

 

우리 학교 문헌정보학과는 수도권 특성화 사업의 일환으로 국가 지원을 받아 ‘데이터사이언스학과를 신설했다. 우리 학교는 이를 통해 인문학적 가치관을 바탕으로 IT 응용 능력과 과학적 분석 방법론을 갖춘 데이터 사이언티스트를 양성하는 데 힘쓸 예정이다. 이에 현재 데이터 사이언스, 비즈니스 개발, 서비스 디자인 컨설턴트로 활약하고 있는 고넥터(Gonnector) 고영혁 대표를 만나 데이터 사이언티스트가 되기 위해 필요한 역량은 무엇이고, 그 역량을 갖추기 위해 고영혁 대표 본인은 어떤 커리어를 쌓아왔는지 이야기를 나누어 보았다.
▲ ⓒ강신강 기자 skproject@skkuw.com

 

어떤 일을 하고 있는지 설명해 달라.

현재 고넥터의 창립자이자 CEO로 활동하고 있다. 고넥터는 △UX(User Experience) △데이터사이언스 △사업개발 △서비스디자인 △스타트업 △시각화 △커리어에 대한 컨설팅, 자문, 심사, 교육 서비스를 제공하고 있는 회사다. 그 이전에는 NHN Games 콘텐츠전략팀 팀장으로 △비즈니스 정보 시스템 디자인 △콘텐츠 사업 모델링과 운영 △콘텐츠 소비 행태 분석 △콘텐츠 전략 수립을 전문으로 다뤘다. eBay Gmarket 금융사업파트 파트장의 직책을 맡아 전자상거래 플랫폼에 기반을 둔 금융권과의 제휴사업 업무를 처리했으며, 웹 트래픽과 탐색 패턴을 분석하는 일을 하기도 했다.

 

데이터 사이언티스트는 어떤 사람이라고 생각하나.

수많은 데이터 안에서 현실 세계에 가치 있는 데이터를 뽑아내는 것이 ‘데이터 사이언스’라고 생각한다. 데이터 사이언티스트는 바로 이런 가치를 뽑아내는 사람이다. 데이터 속에서 가치를 얻어내기 위해서는 우선 대량의 데이터를 차곡차곡 쌓아야 한다. 그 다음에는 쌓인 데이터를 잘 정돈해야 하고, 불필요한 데이터도 걸러내야 한다. 일차적으로 정리된 데이터를 잘 살펴보면서 ‘이게 어떤 의미가 있겠다’라고 세부적으로 분석하고 정리해서 가치를 뽑아내면 된다. ‘DIKW 피라미드’라는 것이 있다. ‘Data’를 정리하면 ‘Information’이 되고 이것이 경험과 결합 되면서 ‘Knowledge’가 된다. 이렇게 쌓인 지식이 점점 더 경험과 엮이고 쌓이면서 ‘Wisdom’이 되는 것이다. 결국 Wisdom을 얻기 위해 가장 밑에 있는 Data를 차곡차곡 정리하고 분석하는 과정 전체가 데이터 사이언티스트가 해야 할 일이며, 동시에 데이터 사이언스라고 보는 것이다. 이러한 과정에서 시각화와 여러 가지 분석 기법들도 필요하겠지만, 핵심은 데이터에서 가치를 뽑아내는 일이다.

 

데이터 사이언티스트가 되기 위해 어떤 것을 준비하면 도움이 되는지.

첫째는 ‘수학’이다. 데이터 분석을 위해서는 수학적 사고가 필요하다. 어떤 현상을 수식 몇 개로 표현할 수 있는 능력과 수학적인 모델링을 적용했을 때 그것이 특정한 현상에 어떤 영향을 줄 수 있을지 이해할 수 있는 관점도 중요하다. 이런 관점을 키우기 위해서는 수학적 개념이 실제로 어떻게 응용되는지 살펴봐야 한다.

둘째는 ‘통계학’이다. 엄청난 데이터 속에서 의미를 뽑아내려면 패턴을 볼 수밖에 없는데 이 때 통계학적 사고가 필요하기 때문이다.

셋째는 ‘프로그래밍’이다. 데이터가 워낙 방대하다보니 사람이 이를 모두 관리하는 것은 불가능하므로 기계가 대신해야 하는데 이 때 필요한 능력이 바로 프로그래밍이다. 이와 함께 알고리즘이나 데이터 구조론, 데이터 아키텍쳐 같은 것들까지 점점 더 영역을 넓혀가면서 공부하면 좋다.

넷째는 ‘하둡’이다. 하둡은 여러 개의 저렴한 컴퓨터를 마치 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술이다. 엄청난 양의 데이터를 다루어야 하기 때문에 하둡에 대한 지식도 필요하다.

다섯 번째는 ‘머신 러닝’이다. 머신 러닝이란 컴퓨터에 학습 가능한 인공 지능을 부여하는 것을 연구하는 학문 분야다. 머신 러닝은 활용하기에 따라서 굉장히 강력한 예측을 제공하거나 인간의 처리 능력으로는 빨리 알 수 없는 것들을 신속하게 알 수 있게 해준다.

여섯 번째는 ‘분야에 대한 전문성’이다. 결국 어떤 분야에 데이터를 쓸 것인가 하는 문제이기 때문에 데이터의 태생과 데이터가 어떻게 사용되느냐에 대한 이해 없이는 의미 있는 데이터를 추출할 수가 없다.

마지막이 ‘커뮤니케이션 능력’이다. 모든 능력을 개인이 혼자 완벽하게 갖추기란 어려워 결국 팀을 짜서 일을 해야 하는데 이를 위해서는 커뮤니케이션이 중요하다. 이 7가지 사항 중에서 자신이 좋아하고 자신 있는 분야부터 차근차근 공부해나가기를 추천한다.

▲ 데이터 사이언티스트가 되기 위해 준비하면 도움이 될 역량 7가지를 나타낸 그림이다.

 

앞으로 데이터 사이언티스트의 미래를 어떻게 전망하는가.

데이터 사이언스 시장은 확대 될 수밖에 없다. 지금도 데이터가 계속해서 불어나고 있기 때문이다. 앞으로 빅데이터를 다루는 기업이 훨씬 더 늘어날 것이다. 그 데이터들로부터 가치를 뽑아내야 하니까 여러 가지 기회가 많아질 수밖에 없다. 이 점은 명확하다. 하지만 어떤 회사가 고도의 지식이 없어도 데이터에서 가치를 뽑아내는 프로그램을 만들어서 전 세계 기업들이 그 프로그램을 쓴다고 하면 이 상황에서는 뛰어난 데이터 사이언티스트가 필요 없을 수도 있다. 컴퓨터가 다 해 주기 때문이다. 앞으로의 상황을 좀 더 지켜봐야 한다.