검색의 한계를 뛰어넘는 디스커버리 기술은 어떤 것?

2009.09.08 19:13:59 / 최용수 기자 yongs@ddaily.co.kr

검색기술컨퍼런스 STS2009 열려

 

검색엔진 검색창에 “소녀시대의 히트곡은?”이라는 질문을 던져 보자. ‘소녀시대’라는 단어와 ‘히트곡’이라는 단어가 포함된 문서를 보여준다.

 

이 문서를 읽어보면 ‘지(GEE)’ ‘소원을 말해봐’ 등 원하는 대답을 얻을 수 있다.

이번에는 ‘소녀시대와 2NE1의 관계는?”이라는 질의어를 넣어 보자. ‘소녀시대’ ‘2NE1’ ‘관계’라는 단어가 포함된 문서가 검색결과에 나오지만, 이 문서 안에서 원하는 답을 찾기는 쉽지 않을 것이다.

현재 우리가 사용하는 검색엔진의 한계다. 좀더 똑똑한 검색엔진을 개발할 수는 없을까.

‘디스커버리’가 그 대안으로 떠오르고 있다.

카이스트의 맹성현 교수는 8일 서울 삼성동 인터코티넨탈호텔에서 “미래의 검색엔진은 검색 결과가 어떤 것과 연결됐는지, 상호연결성을 파악할 수 있어야 한다”면서 “앞으로는 디스커버리가 기술적 트랜드가 될 것”이라고 말했다.

디스커버리란, 기존의 검색이 진화한 형태로 비정형 텍스트 문서로부터 유용한 정보를 추출해 내는 텍스트마인닝을 활용해 문서의 내재된 의미를 찾아내는 것이다. 여기에 사용자의 의도, 문서의 다양한 범주적 특성 및 연관성 등을 총체적으로 파악해 고급정보를 제공하는 것이다.

즉, 정보의 검색과 추출, 필터링을 통한 세분화, 클러스터링, 주제와 트렌드 분석, 요약 등의 과정을 거쳐 사용자가 원하는 정보와 가장 일치하는 검색결과를 제공하는 것이다.

또 그는 디스커버리는 시맨틱으로 가야한다며 시맨틱 기술의 활용을 강조했다.

그는 웹서치와 사용자 로그 데이터를 통해 얻는 사용자의 시맨틱스가 중요하다며 이런 요소를 어떻게 얻어가느냐가 검색기술의 강자가 될 수 있는 요건이라고 말했다.

아울러 사용자의 정보 요구가 한 세션에서도 계속 변하기 때문에 이를 예측해서 찾아주는 것 또한 중요하다고 덧붙였다.

발표를 마치며 그는 "리소스 공유를 통한 기술발전이 중요하다"라며 국내 검색기술 진보를 위해 힘을 합쳐야 한다고 역설했다.

<최용수 기자> yongs@ddaily.co.kr









네이버 뉴스스탠드에서 디지털데일리 뉴스를 만나보세요.
뉴스스탠드


  • IT언론의 새로운 대안-디지털데일리
    Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
 
· [카드뉴스] 기업의 지속가능성 해법은 결국···
· [카드뉴스] B tv 서라운드, 거실을 영화관으로
· [이지크로] 안전하고 믿을 수 있는 에스크로
  • 동영상
  • 포토뉴스
“에어팟 잡겠다”...무선이어폰 후발 주자들… “에어팟 잡겠다”...무선이어폰 후발 주자들…
  • “에어팟 잡겠다”...무선이어폰 후발 주자들…
  • LG전자, “CGV 갈 때 스마트폰만 들고 가세…
  • 설 연휴, 아프면 어쩌나 “T맵이 문 연 병원 알…
  • 삼성 ‘프리즘’ vs LG ‘AI’…에어컨 이어…