기자명 성대신문 (webmaster@skkuw.com)

인공지능 핵심은 데이터
언어와 인공지능 분야의 무한한 가능성

 

지난달 30일, 국어국문학과와 글로컬문화콘텐츠연계전공에서 주최한 ‘인공지능 시대 인문학도의 전략’ 특강이 경영관(33305호)에서 개최됐다. 서울대 국어국문학과 출신 인공지능 개발자인 바이칼AI의 윤기현 대표가 강사로 초빙됐다. 윤 대표는 인공지능에 대한 전반적인 지식과 함께 언어에 인공지능 기술이 어떻게 적용될 수 있는지를 설명했다. 강연은 △인공지능 △머신러닝과 딥러닝 △데이터 중심사고 △인문학과 인공지능 △언어 처리 순으로 진행됐다.

윤 대표는 “인공지능의 출현은 위기가 아니라 기회다”라며 인공지능에 대한 오래된 편견을 깨뜨리는 것으로 강의를 시작했다. 다음으로 인공지능을 구현하는 구체적 방법인 머신러닝과 딥러닝을 소개했다. 머신러닝과 딥러닝은 기본적으로 알고리즘을 이용해 데이터를 분석하고, 학습하며, 학습한 내용을 기반으로 판단이나 예측을 한다는 점에서 동일하다. 이 둘의 차이점은 ‘데이터의 특징을 자동으로 골라내는가’에서 비롯된다. 머신러닝의 경우에는 사람이 확인해야 할 특징을 모두 정의해주기 때문에 인공지능은 간단한 계산만 담당하면 된다. 반면 딥러닝은 한 걸음 더 나아가 인공지능이 자동으로 데이터에서 특징을 뽑아내도록 한다. 그는 “딥러닝은 복잡한 자료들이 많은 음성인식, 자연어 처리 등의 분야에 적용돼 좋은 결과를 보여주고 있다”고 설명했다.

윤 대표는 “인공지능의 핵심은 데이터”라고 말했다. 그리고 이를 위해서는 데이터 중심 사고가 필요하다고 강조했다. 데이터 중심 사고는 대규모 데이터를 효율적으로 활용하는 접근 방법을 뜻한다. 그는 “머신러닝이나 딥러닝이나 모두 데이터를 준비하는 과정이 선행되는데, 짧게는 1달, 길게는 1~2년도 걸린다”고 말했다. “프로그램을 실질적으로 돌리는 데는 대략 한 시간도 안 걸리는 것을 생각하면, 데이터 수집과 분석은 개발하는 과정에서 큰 부분을 차지한다”고 데이터 중심 사고의 중요성을 재차 언급했다.

그는 이런 지식을 기반으로 언어 처리에 관해 설명했다. 언어 처리는 인공지능 스피커와 챗봇 등 인간과 대화하는 컴퓨터 관련 기술을 말한다. 세부 분야로는 △자연어 처리 △자연어 이해 △정보 검색 등이 존재하고 그는 이를 차례대로 설명했다. 자연어 처리는 형태소 분석이나 구문 분석을 뜻한다. 구문에서 인물, 작품 등 단어에 알맞은 객체 명을 달아주거나 품사를 구분하는 것이다. 자연어 이해는 보다 더 넓은 개념으로 구문의 의도를 이해하는 것을 지칭한다. 이를 통해 의존관계를 분석하거나 담화, 감정 등을 파악한다. 윤 대표는 언어 처리와 관련된 여러 기술도 소개했다. 대표적으로 워드 임베딩(Word Embedding) 기술은 단어들의 유사성을 측정하여 구문이나 질문의 의도를 파악하는 기술이다. 또한 텍스트 분류 기술은 텍스트의 카테고리를 부여해주는 기술로 신문 기사를 분류할 때 사용된다. 윤 대표는 “아직 언어 쪽으로 해결되지 않은 것이 많다”며 언어 처리 분야는 발전 가능성이 큼을 강조했다.

윤 대표는 강의가 끝난 후 “선배로서 문과 계열 학우들의 취업난을 보며 안타까웠다”며 “이번 특강을 통해 후배들에게 인문학도들이 활약할 수 있는 분야인 인공지능을 소개할 수 있어서 만족스럽다”고 소감을 말했다. 이날 강연을 들은 최새흰(국문 15) 학우는 “평소 번역에 관심이 있어서 인공지능과 문학 분야의 협업에 대해 알아보고 싶었다”며 “어떤 유형의 인공지능이 있고 어떤 방식으로 작동하는지에 대한 구체적인 정보들을 배울 수 있어 흥미로웠다”고 참가 소감을 밝혔다.