-그래프DB·AI 접목한 새 비즈니스 모델 창출, 기업·공공 복잡한 문제 해결

[디지털데일리 백지영기자] “지금 국내 IT업계에는 ‘몽유도원도’를 그린 안견과 같은 화가가 필요합니다. 왕의 꿈(기업이 원하는 것)과 같은 불확실성을 그려내야 합니다. 이를 위해선 그래프DB와 인공지능(AI)이 필요하죠.”
 
‘한국의 데이터 구루’라 불리는 이화식 엔코아 대표<사진>는 지난해 초부터 ‘그래프DB’에 푹 빠져있다. 2년 가까이 잠자는 시간을 제외하고는 그래프DB를 연구하고 관련 자료를 만들어 직원들에게 공유하는 작업을 하고 있다. 수천개에 달하는 관련 논문을 일일이 검색해 찾아 공부한다. 한번 마음을 먹으면 모르는 것을 알 때까지 끝까지 파고드는 성격 탓이다.

지난 6일 서울 서초동 엔코아 사옥에서 만난 이화식 엔코아 대표는 “인생을 3막으로 봤을 때 1막은 데이터베이스(DB), 2막은 데이터 아키텍트, 3막은 그래프DB와 AI를 통해 마지막으로 데이터 분석분야에 새로운 바람을 일으키고 싶다”고 말했다.

DB 기술의 바이블로 여겨지는 ‘대용량 DB 솔루션’의 저자로 오라클 관계형DB(RDB) 분야의 신화(?)를 창조해온 그가 갑자기 그래프DB에 빠진 이유는 무엇일까.

그에게 그래프DB는 기존의 복잡한 데이터 문제를 해결하는데 필요한 하나의 수단일 뿐이다. 이 대표는 “그래프DB가 가진 네트워크, 토폴로지 개념이 지금까지 하지 못했던 영역을 담고 있다”며 “이를 잘 활용하면 지금까지 못 풀었던 문제를 해결할 수 있을 것이라고 생각한다”고 운을 떼었다.

세상의 모든 일은 단편적인 사실로 증명되기보다는 얽히고 설켜 있는 복잡한 것들이 대부분이다. 부동산 문제가 대표적이다. 이는 단순한 수요와 공급으로는 설명이 되지 않는다. 지역적인 특성과 소유욕, 교육문제 등이 복합적으로 얽혀있어서 연쇄 반응을 일으킨다. 

그는 “DNA 분석이나 공급망, 쉽게는 네비게이션만 봐도 몇 겹의 데이터 레이어만 더 얹어지면 퀄리티는 훨씬 높아진다”며 “이러한 데이터를 가장 쉽게 모델링할 수 있는 것이 그래프DB이며, AI 영역과 결합된다면 그동안 인간이 할 수 없었던 복잡한 문제를 해결되고 기업의 의사결정자에 통찰력을 제공할 수 있을 것”이라고 말했다.

실제 그래프DB는 지난해 가트너의 상위 10대 기술트렌드에 포함되면서 최근 높은 관심을 받고 있다. 기존의 RDB와는 달리 데이터 간 연관성에 초점을 맞춘 것이 특징이다. 지난 2016년 전현직 정치인과 지도자, 유명인사의 조세회피 의혹을 파헤친 파나마 페이퍼스에 네오4j의 그래프DB 기술이 활용됐다는 사실이 알려지며 유명세를 타기 시작했다.

그는 “이전에는 한정된 표본 데이터를 갖고 식을 만들어 내면 끝이었지만, 이제는 숨어있는 키-팩터를 찾아 연관성을 대입해야 한다”며 “대형마트에서 기저귀와 함께 가장 잘 팔리는 물건이 맥주라는 것을 찾아내는게 대단한 빅데이터 분석인냥 여기는 것은 눈속임일 뿐”이라고 지적했다.

예컨대 잔잔한 연못에 돌을 던지면 파장이 생긴다. 돌을 하나만 던지면 동심원이 하나가 생기지만, 여러 개를 동시에 던지면 몇 개의 파장이 생기고, 이 파장과 파장이 만나 간섭현상이 발생한다. 던지는 시점이나 돌의 크기, 위치에 따라 간섭이 계속해서 일어나면 조용하던 연못은 시끄러워진다. 

또, 너울성 파도가 해일로 변한다거나, 소프라노 성악가가 노래를 부르자 와인잔이 깨지는 것, 1940년 미국 타코마에서 강풍이 불었을 때 초속 53미터에서 견디도록 설계된 다리가 불과 초속 19미터에서 점점 크게 흔들리다가 무너진 것. 이는 모두 공진현상에 의해 발생한 일들이다. 

이처럼 다양한 현상이 서로에게 영향을 미치는 연관성은 그래프DB를 통해 풀수 있다. 인간이 알 수 없는 아주 복잡한 현상을 모델링해야 하기 때문에 기존처럼 숫자로 푸는 전산으로는 할 수 없다는 것이 그의 설명이다. 이러한 문제를 풀기 위해선 표본 데이터만으로는 부족하다. 밑바닥의 데이터부터 메꾸고 숨어있는 인사이트를 찾아서 가공을 해야 한다. 지구상의 모든 도메인 지식이 필요한데, 결국 AI와 연결될 수 밖에 없다. 

현재 AI 학습을 위한 인풋 데이터에는 크게 자연어처리, 음성인식과 같은 텍스트 데이터, 수치화된 벡터 데이터, 그리고 그래프 데이터가 있다. 그는 “텍스트나 벡터데이터가 인풋인 경우에는 단순한 데이터의 양을 많이 학습시키면 되지만, 그래프DB는 얽히고 섥혀있는 것들을 데이터로 만들어 넣어야 해 쉽지 않다”며 “이 분야는 아직 사람도 거의 없고 준비도 안 되어 불모지 같은 상황”이라고 말했다.

그는 이어 “그래프DB는 여러 데이터가 얽혀있을 때 가장 유사성이 강한 것을 찾는 개념이다 보니 기존 밸류 중심으로 값을 처리하는 것과 다른 가공방식이 나온다”며 “또 현실적으로 찾을 수 없는 데이터가 워낙 많기 때문에 중간 가공을 통해 예측하는 기술도 필요하다”고 말했다.

궁극적으로 기업에 맞는 데이터를 잘 풀어내고 원하는 것을 함께 같이 찾기 위해선 몽유도원도를 그리는 화가의 역할이 필요하다는 것이 그의 설명이다. 조선시대의 화가 안견이 세종의 셋째왕자인 안평 대군의 꿈 이야기를 듣고 3일 만에 그렸다는 산수화 ‘몽유도원도’처럼 이제는 기업의 원하는 꿈(결과)를 보여줄 수 있는 데이터 사이언티스트(과학자)가 필요하다는 것.

이를 위해 엔코아는 현재 그래프DB와 AI 부문 정직원을 신규 채용 중이다. 엔코아는 직원 채용 시 ‘데이터 사관생도 프로그램’이라고 이름을 붙이고 있다. 단순한 직원 채용이 아니라 이화식 대표가 직접 강의와 실습, 프로젝트를 진행해 데이터 분석 전문가를 양성하는 교육 과정이 선행되기 때문이다.

그는 “현재의 IT업계에는 붓놀림이 강한 사람만 있고 화가는 없다”고 진단하며 “이번에 모집하는 사관생도는 마치 ‘독수리5형제’처럼 별도의 팀을 꾸려 함께 연구하고 각자의 가진 장점을 바탕으로 세상에 없던 차별화된 길(영역)을 만들어 나갈 것”이라고 자신했다.

그는 “‘냉장고를 부탁해’와 같은 TV 프로처럼 한정된 재료으로 15분이라는 시간 내에 먹어본 적이 없는 새로운 음식을 만들어야 하는 것은 30년 간 짜장면을 만든 중국집 주방장의 숙련된 솜씨 뿐 아니라 창의성이 필요한 일”이라며 “오늘날과 같은 데이터 먹방시대에 그래프DB와 네트워크 이론을 바탕으로 빅데이터 분야의 (주방장이 아닌) 스타 쉐프를 만들고, 내가 가장 잘하는 세상에 없는새로운 길을 열어주고 싶다”고 강조했다.

<백지영 기자>jyp@ddaily.co.kr


네이버 뉴스스탠드에서 디지털데일리 뉴스를 만나보세요.
뉴스스탠드


  • IT언론의 새로운 대안-디지털데일리
    Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
 
[이지크로] 안전하고 믿을 수 있는 에스크로
  • 동영상
  • 포토뉴스
[PLAY IT] 댕댕이도 리모컨도 언제나 내… [PLAY IT] 댕댕이도 리모컨도 언제나 내…
  • [PLAY IT] 댕댕이도 리모컨도 언제나 내…
  • [르포] 삼성·LG, 백화점도 ‘체험형 매장…
  • KT, “전국 매장에서 QR 찍으면 할인 펑펑”
  • KT, 올레tv 키즈랜드 ‘영어놀이터’ 새 단장