폐암건진 등의 목적으로 촬영하는 흉부 저선량 CT에서 인공지능을 이용하여 폐기능 검사가 필요한 환자를 분류 논문정보
최근 문제가 되고 있는 만성기도성폐질환(COPD) 등의 질환은 병이 진행될수록 호흡이 어렵게 되면서, 삶의 질을 낮추게 되어 조기 발견과 치료가 중요하다.
폐활량계(spirometry)를 이용한 폐기능 검사(PFT)는 이러한 주요 호흡기 질환의 진행도를 파악하는 데에 중요한 검사이나, 비용 및 시험의 정도관리에 어려움이 있어 대규모의 선별검사는 이루어지지 않고 있다.
한편, 흉부 저선량 CT 영상은 방사선을 통해 3D 구조의 내부를 파악하는 데에 사용되며 의료영역에서 체내의 폐결절, 기흉 등의 구조적 이상 유무를 발견하는 데에 가장 유용한 장치로 쓰이고 있다.
특히 2018년부터는 흉부 저선량 CT를 통해 폐암의 조기 진단을 위한 국가 주도의 암검진 사업이 시행되어 만 54세 이상 만 74세 이하의 남·여 중 폐암 발생 고위험군에 대해 2년에 한 번 흉부 저선량 CT촬영을 통한 검진을 지원받고 있다.
이 저선량 CT에는 폐암의 정보 말고도, 폐에 대한 다양한 정보를 가지고 있다. 따라서, 인공지능기술을 이용해 저선량 흉부CT 영상으로부터 폐기능을 예측할 수 있으면, 만성폐쇄성폐질환(COPD)과 같은 호흡기 질환의 조기 발견 및 치료에 큰 도움이 될 것으로 전망된다.
본 연구는 서울아산병원 융합의학과 김남국 교수, 박현정 박사과정, 호흡기내과 이세원 교수 공동연구로 수행되었다. 서울아산병원에서 2015년 1월부터 2018년 12월까지 건강검진을 받은 16,148명의 저선량 CT 영상과 폐활량 데이터를 이용하여, 딥러닝을 통해 CT 영상에서 노력성폐활량(FVC), 1초간 노력성호기량(FEV1)을 예측하는 모델을 개발하고 실제 측정값과 일치도를 평가하였다.
연구 결과, 폐활량계의 측정치와 딥러닝 예측값이 높은 일치도를 보였으며, 위험군에 대한 분류 성능도 0.85~0.90의 높은 정확도(민감도-특이도 곡선 면적, AUROC)를 나타냈다. 폐활량계의 측정치와 딥러닝 예측값은 FVC, FEV1에 대해 각각 0.22, 0,22 Liter 절대평균오차와, 0.93, 0.90의 상관계수를 보였다.
또한 딥러닝 예측 값을 이용해 임상에서 만성기도성폐질환 위험군을 분류할 때 쓰이는 지표인 정상치 대비 비율(FEV1%pred, FVC%pred)과 두 지표의 비율(FEV1/FVC)을 계산하고, 이를 통해 폐기능 위험군에 대한 분류 성능을 확인하였다. 위험군에 대한 분류 성능은 대략 0.85~0.90의 정확도(민감도-특이도 곡선 면적, AUROC)를 보였다.
CT 영상에 나타나는 해부학적 특징들과 폐기능과의 연관성에 대한 연구는 이전에도 발표된 바 있지만, 인공지능 알고리즘을 활용하여 영상만을 이용해 폐기능을 예측하는 연구는 아직 시작 단계에 있다. 이에 따라, 이번 연구의 결과로 호흡기 질환 조기 발견 및 치료에 도움이 될 것으로 전망된다.
앞으로 연구팀은 이 기술의 민감도를 개선하고, 대규모 코호트 연구를 통해 다양한 환자군에 예측 정확도를 높이는 방안을 모색할 것이다. 이러한 노력을 통해 인공지능 기반의 폐기능 예측 기술은 호흡기 질환 환자들에게 더욱 효과적인 조기 진단 및 치료를 제공하는 데 기여할 것으로 전망된다.
호흡기내과 이세원 교수는 “CT는 건강검진을 통해 광범위하게 시행하지만, 폐기능 검사는 대규모 선별검사가 어려워서, 많은 흡연자들이 폐기능 저하로 인한 질환이 가능함에도 조기에 진단이 이루어지지 못하고 있다. 본 연구는 CT를 통해 폐기능을 예측하는 모델을 제시함으로써 이런 미충족 의료 수요에 대한 하나의 해결 가능성을 제시한 것”이라고 하였다.
융합의학과 김남국 교수는 “형태는 기능을 따른다는 미국의 건축가 루이스 헬리 설리번의 말처럼 사람의 몸의 구조도 기능을 반영합니다. 주로 구조를 촬영하는 의료 영상에서 기능을 예측할수 있으면 다양한 의료 분야에서 좀더 적극적으로 환자를 조기에 진단 및 지료를 제공할수 있다고 생각합니다.”라고 하였다.
이번 연구결과는 Radiology (인용지수 29.146) 온라인판에 2023년 2월 14일에 게재됐다.
▲ 그림 1. 흉부 CT 이미지에서 폐 기능 검사 결과를 예측하는 딥러닝(DL) 시스템 모식도
딥러닝 모델은 인플레이션된 3차원(I3D) 컨볼루션 네트워크를 기반으로 강제 폐활량(FVC) 및 1초간 강제 호기량(FEV1)의 측정값을 예측하도록 학습되었으며, 이러한 값을 사용하여 FVC 및 FEV1 예측 비율(FVC% 및 FEV1%) 값을 계산하여 나중에 위험군을 분류하는 데 사용했다. 호흡기 위험군 화자 분류기를 평가하기 위해 민감도-특이도 곡선 면적(AUC), 정확도, 민감도, 특이도를 사용했다.
▲ 그림 2. (A, B) Grad-CAM의 평균 강도는 폐 기능 검사 값의 모델 예측을 위한 영역을 시각화
강제 폐활량(FVC) 예측 모델(A)과 1초간 강제 호기량(FEV1) 예측 모델(B)에서 각 Grad-CAM 히트 맵의 주목할 만한 특성을 보여주고 있다. 빨간색은 더 높은 FVC 및 FEV1 값을 예측할 때 관련성이 높음을 나타낸다.
※ 김남국 교수는 2014년부터 서울아산병원 의공학과/영상의학과 및 의공학연구소에 재직 중이다.
현재 정교수로 의료인공지능 및 3D 프린팅 등을 이용한 중개연구에 매진하고 있다. 영상의학과, 병리과, 호흡기내과, 마취과, ICU, ER, 소화기내과, 종양내과, 유방외과 등 다양한 임상과와 협력하여 각종 질환에 대한 중개연구를 진행 중이며, 다수의 국책 과제를 수행 중이다.