인공지능(AI)은 의료 분야에서 급격히 진화하며, 의사와의 협업 또는 비교 대상으로 자주 언급됩니다. 특히 진단 정확도와 관련하여 "AI가 과연 의사만큼 정확한가?"라는 질문은 많은 관심을 받고 있습니다. 본 글에서는 AI와 의사의 진단 정확도 차이를 중심으로, 오진율 비교, 그리고 협업 모델의 시사점에 대해 심층 분석합니다.
AI와 의사의 진단 정확도 비교
의료 인공지능은 특히 영상 판독 분야에서 빠르게 성능을 끌어올리며 의사들과 비교되는 수준에 도달하고 있습니다. 대표적으로 폐암, 유방암, 피부병 등 영상 기반 질환 진단에서는 AI가 상당히 높은 정확도를 기록하고 있습니다.
스탠퍼드대학의 연구에 따르면, 피부병 진단에서 딥러닝 AI 모델은 전문 피부과 의사와 유사하거나 일부 영역에서 더 높은 정확도를 보였습니다. 유방암 진단에 있어 구글헬스의 AI는 미국 내 영상의학 전문의 평균보다 오진율은 5.7% 낮고, 진단 정확도는 평균 1.2% 높았습니다.
하지만 모든 영역에서 AI가 의사를 능가하는 것은 아닙니다. 내과, 정신과, 외과 등 환자의 상태를 종합적으로 고려해야 하는 영역에서는 여전히 인간 의사의 판단력이 우세합니다. AI는 수치나 이미지를 기반으로 하는 진단에는 강하지만, 복합적인 병력, 사회적 요인, 비정형 증상을 다루는 데는 한계가 있습니다.
요약하면, AI는 특정 영역에서 ‘전문 의사급’ 정확도를 달성하고 있으며, 점점 더 많은 진단 업무에서 인간과 유사한 판단을 내릴 수 있는 수준으로 진화하고 있습니다. 그러나 전반적인 의료서비스 전반을 완전히 대체하기엔 아직 보완이 필요한 단계입니다.
오진율과 한계점 비교
정확도와 더불어 중요한 지표가 바로 오진율입니다. AI는 훈련된 데이터셋에 기반하여 판단하기 때문에 일관성 면에서는 강하지만, 비정형적이거나 학습 데이터에 없는 희귀질환, 예외 상황에 대해서는 오진 가능성이 높습니다.
예를 들어, MIT 연구팀은 AI 기반 폐렴 진단 시스템이 특정 병원에서는 높은 정확도를 보였지만, 다른 병원에서는 성능이 크게 떨어지는 현상을 발견했습니다. 이는 AI가 병원 간 영상 품질 차이, 환자 인구군 차이, 촬영 프로토콜의 차이에 민감하게 반응한다는 뜻입니다.
반면 인간 의사는 상황에 따라 유연하게 대처할 수 있다는 장점이 있습니다. 실제로 임상 현장에서 의사는 환자의 표정, 말투, 병력 등 다양한 정성적 요소를 고려하여 진단을 내립니다. 이는 AI가 현재로서는 따라하기 힘든 부분입니다.
그렇다고 AI의 오진율이 심각하다는 의미는 아닙니다. 일부 연구에서는 AI의 오진율이 인간보다 낮은 결과도 있습니다. 예컨대 루닛의 흉부 X-ray AI는 오진율 3.1%를 기록했는데, 이는 기존 영상의학과 전문의 평균 오진율 6%보다 낮은 수치였습니다. 이처럼 AI의 성능은 특정 조건에 따라 인간 의사를 능가할 수도 있지만, 한계점도 분명히 존재합니다.
AI와 의사의 협업 모델 효과
AI와 의사의 협업은 ‘대체’가 아닌 ‘보완’의 관계로 진화하고 있습니다. 현재 다수의 병원에서는 AI가 먼저 의료영상을 분석하여 의심 부위를 표시하면, 의사가 이를 검토하고 최종 진단을 내리는 방식으로 협업이 이뤄지고 있습니다. 이 방식은 오진을 줄이는 데 큰 기여를 하고 있으며, 특히 반복 작업이 많은 분야에서 높은 효율성을 보여주고 있습니다.
서울대병원은 AI 협업 시스템 도입 이후 폐결절 조기진단률이 18% 향상됐고, 판독 시간은 평균 25% 줄었습니다. 이는 의료진의 피로도를 줄이고, 더 많은 환자에게 집중할 수 있는 여건을 마련했다는 평가를 받고 있습니다.
또한 AI는 의사가 놓칠 수 있는 미세한 병변까지 감지하여 재검토를 유도하기 때문에, ‘이중 안전망’ 역할도 수행합니다. 실제로 영상의학과 의사들이 AI가 제시한 추가 의심 병변을 통해 조기 암을 발견한 사례는 점차 늘고 있습니다.
협업 모델이 성공적으로 작동하려면, 의료진이 AI의 결과를 맹목적으로 신뢰하지 않고, ‘의사결정의 참고자료’로 활용하는 태도가 필요합니다. 이를 위해 병원 차원의 교육과 시스템 정비, 법적 책임 분담 구조 마련이 함께 이루어져야 합니다.
AI는 특정 진단 분야에서 의사에 근접하거나 능가하는 정확도를 보이고 있으며, 오진율도 점차 낮아지고 있습니다. 그러나 모든 상황에서 인간을 완전히 대체하긴 어렵기에, 협업 모델이 가장 현실적이고 효과적인 접근입니다. 의료 AI는 기술 그 자체보다 ‘어떻게 활용하느냐’에 따라 성패가 갈립니다. 앞으로 AI와 의사의 조화로운 진단 환경을 조성하려는 노력이 더욱 중요해질 것입니다.