일반

에이아이트릭스, 의료 데이터 결측에 숨은 임상적 판단 밝혀

이건한 기자
의료진 판단 반영 결측값과 AI 모델 성능 관계 분석 (ⓒ 에이아이트릭스)
의료진 판단 반영 결측값과 AI 모델 성능 관계 분석 (ⓒ 에이아이트릭스)

[디지털데일리 이건한 기자] 에이아이트릭스는 의료 데이터의 결측(missing data)은 단순한 정보 부족이 아니라 의료진의 임상 판단 결과일 수 있다는 내용을 담은 연구 논문을 발표했다고 2일 밝혔다. 해당 논문은 SCIE급 국제학술지 '임상의학저널(Journal of Clinical Medicine)'에 게재됐다.

이번 연구는 예수병원에서 수집된 일반 내과·외과 병동에 입원한 성인 환자 총 2만4359명의 임상 데이터를 분석해 '데이터를 수집한 임상적 맥락(Informative Presence)'이라는 개념을 실제 의료 현장에서 입증했다. 이 개념은 어떤 검사가 시행되지 않았다는 사실은 환자의 상태에 따라 의료진이 판단한 결과일 수 있다는 뜻이다.

연구팀은 선행 연구를 바탕으로 환자 중증도에 따라 수집되는 데이터와 결측률이 달라질 수 있다는 가설을 검증했다. 이에 따라 환자들을 '동반 질환 지수(CCI)' 기준으로 고위험군(CCI > 3)과 중저위험군(CCI ≤ 3)으로 나눈 뒤 각 집단의 데이터의 결측률과 AI 성능을 비교했다.

연구 결과 상태가 위중한 고위험군은 더 많은 검사를 시행하기 때문에 결측률이 낮았다. 반면 중저위험군은 상대적으로 검사 빈도가 적어 결측률이 높았다. 또한 어떤 위험군이든 환자의 상태가 악화될 것으로 의심되는 경우 의료진이 더 많은 검사를 시행했고, 그만큼 결측률도 낮게 나타났다. 즉, 환자의 중증도와 관계없이 의료진이 임상 악화를 의심할 경우 보다 집중적인 검사를 시행해 결측률이 낮아진다는 의미다.

이처럼 환자 집단 간 검사 빈도와 결측률에는 차이가 있었지만 예측정확도(AUROC)는 전체 환자에서 0.86, 고위험군은 0.86, 중저위험군은 0.85로 중증도에 따른 유의미한 성능 차이는 나타나지 않았다. 단순한 데이터 양보다 검사 시행 여부에 내포된 임상적 맥락을 반영하는 것이 알고리즘 성능에 더 중요한 영향을 미칠 수 있음을 시사한다.

김광준 에이아이트릭스 대표는 "환자 상태에 따라 검사 빈도와 결측 패턴이 다르게 나타나는 만큼 AI 모델도 이러한 중증도별 진료 행태의 차이를 인식하고 해석할 수 있어야 한다"며 "단순히 수치나 양적인 정보에만 의존할 것이 아니라 임상적 판단까지 반영하는 AI 모델이 실제 현장에서 신뢰받고 효과적으로 적용될 수 있을 것"이라고 말했다.

이건한 기자
sugyo@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널