영국 의학 저널 BMJ가 발행하는 Gut에 새 AI 모델 REDMOD(Radiomics-based Early Detection MODel) 연구가 게재됐다. 핵심 결과 한 줄로 요약하면, 복부 CT에서 췌관선암(pancreatic ductal adenocarcinoma)의 임상 진단 평균 475일 전에 미세한 조직 변화를 잡아냈고, 민감도는 73%로 방사선 전문의 평균 39%를 거의 두 배 차이로 앞섰다는 점이다.

췌장암은 침묵의 살인자로 불릴 만큼 조기 발견이 어렵다. 한국 국가암등록통계에서 2017~2021년 기준 췌장암 5년 상대생존율은 15.9%에 그쳤고, 전체 암 평균 72.1%의 4분의 1도 안 된다. 진단이 늦는 게 결정적이다. 이번 REDMOD 연구가 주목받는 이유는 단순 정확도 향상이 아니라, 사람 눈으로 안 보이는 0기 신호를 약 1년 3개월 전에 포착했다는 데 있다.

REDMOD는 어떤 모델인가

REDMOD는 라디오믹스(radiomics) 기반 AI 프레임워크다. 라디오믹스란 CT 영상의 픽셀 단위 텍스처 패턴을 정량 지표로 환산해 분석하는 기법으로, 사람이 화면을 보고 판독할 때 놓치는 미세 차이를 수치로 잡는다. 연구진이 만든 REDMOD는 표준 CT가 보지 못하는 매우 초기 췌장암의 미세한 조직 텍스처 패턴을 잡아내도록 설계됐다.

프레임워크 안에는 자동 췌장 분할(segmentation) 기능이 포함된다. 췌장 경계를 주변 장기로부터 자동으로 떼어내는 작업으로, 사람이 손으로 그릴 때 생기는 정확도 변동 위험을 없앤다. 췌장은 위·십이지장·소장·대장 같은 소화기에 둘러싸여 있어 사람이 손으로 영역을 따는 작업 자체가 까다로운데, 이 단계를 모델이 알아서 해결한다.

임상 진단 475일 전이라는 숫자가 왜 중요한가

연구진은 219명 환자의 복부 CT를 모았다. 모두 방사선 전문의가 처음 봤을 때는 이상 없음으로 판정받았지만, 그 뒤 췌장암 진단을 받은 사람들이다. 그중 87명(40%)은 진단 3~12개월 전, 76명(35%)은 12~24개월 전, 56명(25%)은 24개월 이상(약 3년까지) 전의 영상이었다. 대조군은 3년 뒤까지 췌장암이 발병하지 않은 1,243명이다.

REDMOD는 이 영상에서 임상 진단 평균 475일 전에 전임상 췌관선암의 텍스처 시그니처를 검출했다. 약 1년 3개월 정도 일찍 잡은 셈이다.

전체 민감도(true positive를 잡아낼 능력)에서 REDMOD는 73%, 방사선 전문의는 39%. 거의 두 배 차이다. 2년 이상 일찍 검출한 케이스만 따로 떼어 보면 격차는 더 벌어진다. REDMOD 68%, 방사선 전문의 23%로 약 세 배다.

이게 뭘 뜻하나. 췌장암이 진행하기 전 단계일수록, 즉 사람 눈으로 더 안 보이는 단계일수록 AI가 더 멀리 본다는 뜻이다. 사람이 못 보는 영역에서 AI가 격차를 더 벌리는 구조다.

방사선 전문의와 직접 비교한 격차

이 연구의 가장 강한 비교 데이터는 방사선 전문의와의 직접 대결이다. 같은 CT 영상에 대해 두 쪽이 각각 판정한 결과를 보면 격차가 크다.

차트는 클라이언트에서 렌더됩니다.

모델이 진짜로 췌장암 신호를 잡은 건가, 우연인가

이런 연구에서 가장 의심해야 할 부분은 "그 영상이 정말 그 환자가 결국 걸린 췌장암 신호였나, 아니면 모델이 그냥 무언가 비슷한 패턴에 반응했나"다. REDMOD 팀은 두 가지로 검증했다.

하나, 독립 데이터셋 검증. 여러 병원에서 모은 539명의 독립 환자 그룹에서 81% 이상을 췌장암 없음으로 정확히 식별했고, 미국 NIH의 공개 NIH-PCT 데이터셋(80명)에선 87.5%를 정확히 분류했다. 즉 false positive(없는데 있다고 잡는 오류)가 과하지 않다.

둘, 시간적 일관성. 같은 환자가 몇 달 전에 한 번 더 CT를 찍은 영상이 있는 경우, REDMOD는 90~92%에서 같은 답을 냈다. 우연한 노이즈가 아니라 그 환자에서 실제로 진행 중인 변화를 잡고 있다는 근거다.

왜 췌장암에서 특히 의미가 큰가?

다른 암과 비교해 보면 췌장암의 위치가 더 명확해진다. 한국에선 전체 암 5년 생존율이 약 73%까지 올라왔다. 같은 기간 췌장암은 17% 안팎이다. 30년 가까이 다른 암이 50% 가까이 좋아지는 동안, 췌장암은 한 자릿수 개선에 그쳤다.

이유는 여러 가지지만 결정적인 건 조기 진단의 어려움이다. 췌장은 위 뒤쪽 깊은 곳에 있고, 자각 증상이 거의 없으며, 검사용 고화질 CT는 방사선 피폭이 크다. 일반 검진으로는 잡히지 않고, 잡혔을 때는 이미 3~4기다.

REDMOD는 이 구조에서 한 칸을 비집고 들어간다. 다른 이유로 이미 찍어둔 복부 CT를 다시 분석해 췌장암 신호를 잡는다. 새 검사를 추가하지 않고도 기존 영상에서 정보를 더 끌어내는 방식이다.

하나, 이번 연구는 이미 정상으로 판독된 영상에서 미래의 췌장암을 예측하는 과제였다. 방사선 전문의 본업의 일부일 뿐이다. CT에서 명백한 종양·외상·혈관 이상을 찾는 본업은 따로 있다.

둘, REDMOD의 false positive 비율이 13~19% 정도다. 100명 중 13~19명에서 이상 신호가 있다고 잘못 알리는 셈이다. 그대로 환자에게 알리면 불필요한 추가 검사·심리 부담·의료비가 생긴다. 사람의 검토 단계가 반드시 끼어야 한다.

현실적인 그림은 협업이다. AI가 의심 영상을 골라 올리고, 방사선 전문의가 정밀 판독해 추가 검사를 결정하고, 임상의가 환자 위험도를 종합 평가하는 구조. 유방암 영역에서 이미 AI 단독 판독보다 AI와 방사선 전문의의 결정 위임(decision referral) 조합이 민감도 향상으로 이어진다는 연구가 나온 바 있다. REDMOD도 같은 경로로 갈 가능성이 높다.