기자명 허옥엽 기자 (oyheo14@skkuw.com)

 

 

검색창에 ‘나는 커서 무엇이 될까?’ 또는 ‘내일은 무엇을 할까?’와 같은 질문을 입력하면 과연 자신이 원하는 답을 얻을 수 있을까? 실제로 구글은 이러한 질문에 대답하게 하는 ‘개인화된 검색을 개발하는 것’이 목표라고 밝힌 바 있으며, 현재 사용자에게 최적화된 검색 결과를 제공할 수 있는 기술 개발에 박차를 가하고 있다. ‘시맨틱 웹’(Semantic Web)은 이를 가능하게 만들어줄 가장 유망한 기술이다. 지금처럼 정보의 양이 방대해지고 파편화될수록 시맨틱 웹의 필요성이 더욱 강조될 것이다. 재작년 구글은 시맨틱 웹 검색 서비스로 ‘지식그래프’를 출시했다. 그 결과, 우리는 차세대 인터넷 검색의 시대로 한걸음 더 다가설 수 있게 됐다.
 
 
시맨틱 웹이란
지금까지 정보는 인간이 이용하기 위해서만 처리됐기 때문에 기계가 인식할 수 없었다. 예를 들어 인간은 수많은 숫자 중에 기온을 표시한 숫자와 날짜를 표시한 숫자를 쉽게 구별할 수 있지만, 기계는 이를 구별하지 못하고 모두 같은 숫자로 인식한다. 또한 인간의 언어는 중의성과 다의성을 특징으로 하는 까닭에 어떤 차원에서 의미를 표현하느냐에 따라 표현하고자 하는 의미가 달라질 수 있다.
이를 해결하고자 인터넷의 기반을 닦아 ‘인터넷의 아버지’라고 불리는 팀 버너스 리는 컴퓨터가 자체적으로 웹상의 정보를 탐색하고 수집하여 논리적으로 추론하는 웹 체계를 만들었다. 그것이 바로 시맨틱 웹이다. 다시 말해서, 시맨틱 웹은 현재의 컴퓨터처럼 사람이 마우스나 키보드를 이용해 원하는 정보를 찾아 눈으로 보고 이해하는 웹이 아니라, 컴퓨터가 스스로 이해할 수 있는 웹이라 할 수 있다.
시맨틱 웹의 구현을 이해하기 위해서는 기반 기술인 온톨로지(ontology)와 메타데이터(metadata)를 살펴봐야 한다. 온톨로지는 단어와 그 관계들로 구성된 일종의 사전으로 생각할 수 있다. 온톨로지 속에는 특정 영역에 관련된 단어들이 계층적으로 표현되어 있고, 추론 규칙을 통해 이를 추가적으로 확장할 수 있다. 온톨로지는 시맨틱 웹 응용의 가장 중심적 개념이며, 이 온톨로지가 구조화 돼 있는 데이터가 ‘데이터를 위한 데이터’, 즉 ‘메타데이터’다.
 
시맨틱 웹은 어떻게 사용될까
재작년 구글코리아는 인터넷상의 정보들을 서로 유기적으로 연결하는 자동 알고리즘을 통해 검색을 돕는 시맨틱 검색 서비스, ‘더욱 똑똑한 검색: 지식그래프’를 출시했다. 지식그래프는 문자나 단어의 나열에만 기반해 검색결과를 보여주는 것이 아니라, 현실 세계에 존재하는 대상들과 이 대상을 설명하는 속성들을 상호 연결하고 그 연결 관계를 이해하여 사용자가 찾는 정확한 결과를 제공하는 것이 특징이다. 방대한 정보를 유기적으로 연결하는 지식그래프의 모든 과정은 컴퓨터 알고리즘을 통한 자동 검색기술이 중심을 이루고 있다. 이러한 지식그래프의 최대 강점은 바로 ‘검색의 정확성’이다.
예로, [1984년 저자]를 검색하면 사용자가 찾는 것은 1984년이라는 책의 저자가 누구인지를 의미하는 것임으로, 지식그래프는 1984년과 저자를 개별 단어로 인식하는 대신 1984년의 저자인 [조지 오웰]에 대한 검색 결과를 바로 보여준다. [박정희 배우자]를 검색하면 [육영수]에 대한 검색결과가 나온다. 이는 지식그래프가 사용자의 검색 의도를 이해하기 때문이다. 또한, [황정민]이라는 동명이인을 검색할 경우, 배우 [황정민]과 아나운서 [황정민]의 검색 결과를 보기 쉽게 정리한 지식패널이 따로 나타나며, 웹 검색 결과도 각각 다르게 보여준다. 이 때, 각 지식 패널은 해당 검색어에 대한 정보를 통합적으로 제공한다. 더불어 지식그래프 연결을 따라가며 사람, 장소, 사물들에 대해 보다 자세한 연관 검색이 가능하기 때문에 처음에는 떠올리지 못했으나 사용자가 의도했던 검색 결과에 더욱 쉽고 빠르게 도달할 수 있다.
 
시맨틱 웹이 나아가야 할 길
기존 인터넷은 정보과부하에 의해 한계에 도달했으며, 어떤 형태로든 이 문제를 해결해야 한다. 이에 대한 해결방법은 의미에 의한 정보 접근일 수밖에 없다. 기계가 능동적으로 의미에 기초하여 사용자가 원하는 형태로 정보를 통합하고 가공하여 제공해야 한다는 것이다. 현재 이 문제의 해결 방안으로 제시된 것들 중에 가장 실현 가능성이 큰 것이 바로 시맨틱 웹이다. 시맨틱 웹의 주요 역할은 검색 매커니즘의 개선이지만 웹의 정보들을 서로 연결시켜 이용할 수 있게 해준다는 것에 큰 잠재성이 있기 때문이다. 그러나 시맨틱 웹에 대한 회의적인 시각도 존재한다. 온톨로지 개발하고 통합하여 표준화하는 과정에서 높은 비용과 많은 시간이 필요하기 때문이다. 그렇기 때문에 아직 완벽한 시맨틱 웹 응용시스템은 개발되지 않았다. 특히 온톨로지에 기반해 개념화한 다양한 정보 원천에서 필요한 정보를 찾아 의미에 따라 통합하는 기술은 아직 제한된 영역에서만 이뤄지고 있다. 시맨틱 웹의 가능성을 보여주는 여러 연구가 진행되고 시스템도 만들어졌음에도 여전히 남은 문제가 훨씬 많다. 앞으로 시맨틱 웹이 어떤 양상을 보이며 발전해갈지는 좀 더 지켜봐야 할 것이다.