[디지털데일리 이나연 기자] 네이버웹툰이 시각장애인 웹툰 감상을 돕는 인공지능(AI) 기술을 공개했다. 지금까지 웹툰은 시각장애인이 이용하기 매우 어려운 콘텐츠에 속했지만. 네이버웹툰의 의미 있는 도전을 통해 향후 이미지형 콘텐츠 전반의 감상 문턱이 낮아질 것으로 보인다.

네이버(대표 최수연)는 네이버TV를 통해 ‘2022 제10회 널리(NULI) 웨비나’를 개최했다고 5일 밝혔다. 널리 웨비나는 누구나 접근 가능한 디지털 기술 환경 구축을 목표로 다양한 의견과 노하우를 공유하는 자리다. 지난 2012년부터 진행되고 있으며, 올해로 10주년을 맞이했다. 이번 행사는 ‘현재를 넘어, 새로운 세상으로 접근’이라는 슬로건 아래 기획됐다.

2022 널리 웨비나는 ‘4차 산업 기술이 적용된 현재 접근성과 미래기술’이라는 주제로 논의가 진행됐다. 사회적 기업 엔 비전스(N VISIONS)에서 근무 중인 전맹 테스트 엔지니어를 비롯해 ▲네이버와 네이버웹툰, ▲카카오 ▲카이스트(KAIST) ▲고려대학교 등 기업 및 학계 전문가가 참여해 다양한 접근성 향상 방안과 디지털 포용 방법에 대한 연구 내용 및 실제 사례를 공유했다.

이날 네이버웹툰은 AI를 활용한 웹툰 대체 텍스트 자동 제공 서비스를 소개하며, ‘배리어프리(Barrier Free) 웹툰’ 도입을 위해 서비스를 기획한 의도 및 개발 과정을 전달했다. 네이버웹툰은 완결 및 연재 중 회차 약 18만개에 웹툰 대체 텍스트를 적용해 내년 1월 배리어프리 웹툰 베타 서비스를 시작하고 이용자 의견을 반영해 서비스를 보완할 예정이다. 배리어프리 웹툰 베타 서비스는 우선 한국어에만 적용되며 향후 서비스 언어를 점차 확대할 계획이다.

‘시각 장애인들의 웹툰 감상을 위한 작지만 큰 진전’을 주제로 발표를 진행한 윤승섭 네이버웹툰 기획자는 “장애인과 비장애인 사용자를 나누지 않고 모든 사용자라는 관점에서 고민을 이어간 결과 어렵지만 시도해보자라는 결정을 내릴 수 있었다”고 서비스 기획 의도를 설명했다.

시각장애인에게 웹툰 정보를 전달하기 위해서는 웹툰 이미지 정보를 텍스트 정보로 변환하고 이를 다시 청각 정보로 바꾸는 과정이 필요하다. 네이버웹툰은 수천개에 달하는 완결 작품들과 매주 새롭게 추가되는 수백개 회차의 이미지 정보를 빠르게 텍스트 정보로 변환할 수 있는 방법을 찾는 것에 집중했다. 이후 1년여 연구 끝에 ‘AI를 활용한 웹툰 대체 텍스트 자동 제공’ 기술을 개발했다. 텍스트 정보를 청각 정보로 변환하는 과정은 스마트폰 운영체제(OS)에서 기본으로 제공하는 ‘보이스오버(VoiceOver)’나 ‘톡백(TalkBack)’ 기능으로 실현할 수 있다.

웹툰 대체 텍스트 자동 제공은 크게 ▲컷 나누기 ▲대사 영역 추론 ▲대사 추출 ▲대사 순서 결정 네 가지 단계를 거쳐 완성된다. 네이버웹툰이 활용한 기술은 ‘광학문자인식(OCR, Optical Character Reader)’과 ‘웹툰 오브젝트 디텍션(Webtoon Object Detection)’ 기술이다.

웹툰은 대부분 세로로 긴 스크롤 방식으로 제공되기 때문에 한 회차 이미지 크기가 굉장히 크다. 따라서 대사 영역을 추론하고 텍스트를 추출하는 과정에 앞서 컷 나누기 작업이 반드시 선행돼야 한다. 특히 이 과정에서 대사, 말풍선, 컷 라인이 훼손되지 않게 컷을 잘 나눠야 이후 대사를 순서대로 나열할 수 있다. 네이버웹툰은 이를 해결하기 위해 컷, 말풍선, 대사 영역 등을 추론하는 웹툰 특화 객체 탐지 기술 웹툰 오브젝트 디텍션을 개발했다.

컷 나누기 이후에는 웹툰 오브젝트 디텍션을 이용해 대사 영역을 추론한다. 웹툰은 스토리가 전달되어야 한다는 특성 탓에 말풍선 순서를 명확하게 인식해야 하며, 말풍선과 말풍선 밖 대사도 구별할 수 있어야 한다. 또한 건물 간판처럼 배경에 삽입된 텍스트가 대체 텍스트에 포함되면 스토리 전달을 방해할 수도 있다. 범용적인 OCR만으로는 서로 다른 말풍선과 컷의 단어를 한 문장으로 인식하는 경우가 발생해 대사 순서가 섞이는 결과가 발생한다. 네이버웹툰은 웹툰 오브젝트 디텍션으로 대사 영역을 먼저 추론하는 작업을 진행해 이런 오류를 줄였다.

웹툰 오브젝트 디텍션을 통해 추론한 대사 영역의 OCR 결과로 텍스트를 추출하고 추론한 말풍선과 컷의 위치 정보를 활용해 대사 순서를 결정하는 과정을 거치면 웹툰 대체 텍스트가 완성된다. 네이버웹툰은 대사를 누가 했는지 알 수 있는 화자 추론 기능과 대사가 없는 컷에도 대체 텍스트를 제공하는 기능을 개발하는 것을 장기 목표로 삼고 있다.

‘AI로 만드는 웹툰 대체 텍스트’ 발표를 진행한 박준현 네이버웹툰 AI 연구원은 “현재 버전의 대체 텍스트 자동 생성 기술은 아직 초기 단계로, 스토리 전달을 완벽하게 할 수 있는 대체 텍스트를 만들기 위해 계속 도전하고 연구를 진행할 것”이라고 말했다.

김대식 네이버웹툰 AI 리드는 “대체 텍스트 제공은 네이버웹툰이 중요하게 생각하는 ‘다양성’이라는 가치를 지키기 위한 기술적 노력의 일환”이라며 “네이버웹툰은 장애나 언어 등의 장벽 없이 누구나 웹툰을 창작하고 감상할 수 있는 환경 구축을 위해 글로벌 1위 스토리테크 플랫폼으로서 책임과 노력을 다하겠다”고 전했다.

한편, 네이버는 플러터(Flutter) 기술을 통해 지식iN의 앱 접근성을 개선한 경험을 공유해, 새로운 기술이 디지털 정보 접근성에 미치는 영향에 대한 현실적인 사례를 제시했다. 이 밖에도, KAIST와 고려대학교의 연구진들은 각각 게임 속에서 성별, 나이, 신체적 한계를 넘어 연결된 사례와 딥 러닝 모델을 통해 웹툰의 색약과 색각 교정을 해낸 연구 내용을 발표했다.



네이버 뉴스스탠드에서 디지털데일리 뉴스를 만나보세요.
뉴스스탠드


  • IT언론의 새로운 대안-디지털데일리
    Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지
 

English News더보기

  • 동영상
  • 포토뉴스
삼성전자, 인도 뉴델리서 '익스피리언스 스토… 삼성전자, 인도 뉴델리서 '익스피리언스 스토…
  • 삼성전자, 인도 뉴델리서 '익스피리언스 스토…
  • 뉴진스 에디션·삼성D OLED 탑재…'LG 그…
  • 다누리, 달 속살까지 찍었다…NASA 쉐도우캠…
  • 세계가 인정한 LG전자 '97인치 선 없는' OL…

PLAY IT더보기