Skip to main content
Journal of the Korean Society of Radiology logoLink to Journal of the Korean Society of Radiology
. 2024 Jul 25;85(4):693–704. [Article in Korean] doi: 10.3348/jksr.2024.0052

흉부 X선 인공지능 검출 보조 의료기기의 임상 적용: 현황 및 현실적 고려 사항

Clinical Application of Artificial Intelligence-Based Detection Assistance Devices for Chest X-Ray Interpretation: Current Status and Practical Considerations

Eui Jin Hwang 1,
PMCID: PMC11310435  PMID: 39130790

Abstract

Artificial intelligence (AI) technology is actively being applied for the interpretation of medical imaging, such as chest X-rays. AI-based software medical devices, which automatically detect various types of abnormal findings in chest X-ray images to assist physicians in their interpretation, are actively being commercialized and clinically implemented in Korea. Several important issues need to be considered for AI-based detection assistant tools to be applied in clinical practice: the evaluation of performance and efficacy prior to implementation; the determination of the target application, range, and method of delivering results; and monitoring after implementation and legal liability issues. Appropriate decision making regarding these devices based on the situation in each institution is necessary. Radiologists must be engaged as medical assessment experts using the software for these devices as well as in medical image interpretation to ensure the safe and efficient implementation and operation of AI-based detection assistant tools.

서론

인공지능을 통한 혁신에 대한 도전과 기대는 사회의 거의 모든 분야에 걸쳐 활발히 일어나고 있다. 의료 분야 또한 이러한 혁신에 예외가 될 수 없고, 특히 그간 전문의의 영역이었던 의료 영상의 분석 및 평가는 인공지능 기술의 가장 대표적인 적용 분야라고 할 수 있다. 딥 러닝 기술에 기반한 인공지능이 주목받기 시작한 2016년 이후, 다양한 형태 의료 영상 분석에 있어 인공지능이 전문의와 비슷하거나 더 높은 정확도를 보일 수 있음이 여러 연구를 통하여 확인되었다(1,2,3,4,5).

흉부 X선 검사는 여러 의료 영상 검사 중에서도 가장 널리, 많이 시행되는 검사이다. 이러한 임상적 중요성에 더불어, 인공지능 개발을 위한 대규모의 영상 데이터를 비교적 쉽게 확보할 수 있고, 하나의 2차원 영상으로 이루어져 있다는 점은 흉부 X선 검사에 대한 인공지능 기술의 접근성을 높이는 요인이 되었으며, 현재 흉부 X선 검사는 인공지능 기술이 가장 활발하게 적용되고 있는 의료 영상 검사라고 할 수 있다(6,7). 여러 실험적 연구에서 확인된 우수한 성능과 임상 적용 가능성을 바탕으로, 흉부X선 검사를 자동으로 분석, 이상 소견을 검출하는 인공지능이 소프트웨어 기반 의료기기로써 실제 임상 진료에 적용되기에 이르렀으나, 인공지능의 기술적 발전 및 성능에 대한 연구에 비하면 실제 인공지능 의료기기로써 임상 진료에 적용하기 위한 구체적인 과정 및 고려 사항들에 대한 논의는 상대적으로 부족한 것이 현실이다.

따라서 이번 원고에서는, 흉부 X선 인공지능 검출 보조 도구(artificial intelligence-based computer-aided detection; 이하 AI-CAD)의 임상 적용과 관련하여 국내의 현황 및 구체적인 과정과 고려 사항들에 대한 정보를 제공함으로써, AI-CAD의 임상 진료 적용에 관심이 있는 독자들의 의사 결정에 도움이 되고자 한다.

흉부 X선 인공지능 검출 보조 의료기기의 국내 현황

2018년 8월 첫 번째 흉부 X선 대상 AI-CAD가 식품의약품안전처의 의료기기 제조 허가를 받은 이래, 2024년 6월 현재 총 9종의 AI-CAD 의료기기가 식약처의 허가 후에 시판되고 있다(Table 1) (8). 모든 제품들은 하나의 흉부 X선 영상에서 특정한 종류의 이상 소견의 유무를 자동으로 분석하여 그 가능성을 점수의 형태로 제공하며, 검출된 이상 소견의 위치를 흉부 X선 영상에 표시하는 기능을 제공하며, 의사의 판독을 보조하는 도구로써 사용하도록 허가되어 있다(6,8).

Table 1. List of Artificial Intelligence-Based Computer-Aided Detection Devices Approved for Commercialization.

Device Name Manufacturer Date of Approval Age of Validated Performance Training Data Target Abnormality Performance
Auto Lung Nodule Detection Samsung electronics 2019. 6. 7 ≥18 years 17210 X-rays (13710 normal X-rays, 3500 X-rays with nodules; from single institution) Pulmonary nodule Sensitivity, ≥80%; false-positive per examination, 0.15
DCXA DK medical system 2023. 1. 31 ≥19 years 13000 X-rays; from 9 institutions Cardiomegaly, pleural effusion, pneumothorax, pulmonary nodule Sensitivities for each abnormality, 60%–92% or more; specificity, ≥70%
DEEP:CHEST Deepnoid 2021. 10. 13 18–74 years Unknown Pleural effusion, pneumothorax, pulmonary consolidation, pulmonary fibrosis, pulmonary nodule Sensitivities for each abnormality, 60%-92% or more; specificity, ≥70%
JVIEWER-X JLK inspection 2020. 1. 13 Unknown Unknown 16 types of pulmonary abnormalities (unknown detailed information) Accuracy, 94.82%
LuCAS-CXR Monitor corporation 2022. 7. 29 Unknown 8000 X-rays; from single institution Abnormal areas with increased opacity and decreased opacity (unknown detailed information) Sensitivity, ≥85%; specificity, ≥85%
Lunit INSIGHT CXR Lunit 2020. 10. 19 ≥14 years 220000 X-rays Atelectasis, calcification, cardiomegaly, pleural effusion, pneumoperitoneum, Pneumothorax, pulmonary consolidation, pulmonary fibrosis, pulmonary nodule Area under receiver operating characteristic curve, ≥0.85; sensitivity ≥70%; specificity ≥70%
O-View AI Otom 2023. 7. 11 19–90 years Unknown Lung cancer, pneumonia, pneumothorax, pulmonary tuberculosis Area under receiver operating characteristic curve, ≥0.937; sensitivity ≥84.59%; specificity, ≥96.6%
PROS CXR:01 Propmedius 2023. 12. 19 ≥19 years X-rays from domestic institutions and opensource database; unknown number of X-rays Pneumothorax Sensitivity ≥70%; specificity ≥70%
Vuno Med Chest X-ray Vuno 2019. 8. 20 ≥19 years 120000 X-rays; from 6 institutions Interstitial opacity, pleural effusion, pneumothorax, pulmonary consolidation, pulmonary nodule Sensitivity ≥80%; false-positive per examination, ≤1.5

The medical devices are listed in alphabetical order. For duplicate approval for additional functions of the same device, the final approval date is provided. All information is from the Medical Device Safety Library by Ministry of Food and Drug Safety (8).

2023년 4월과 5월에 걸쳐 대한영상의학회 임상연구네트워크에서 시행한 대한영상의학회 회원들의 인공지능 의료기기 사용 현황 조사에 따르면(9), 60%의 응답자(370명 중 223명)가 인공지능 의료기기를 사용해 본 경험이 있었는데, 이는 2020년 American College of Radiology의 조사(30%) (10), 2021년 European Society of Radiology의 조사(52%)와 비교하여 높은 수치였다(11). 인공지능 의료기기 사용 경험 빈도는 삼차 병원(수련병원 67%, 비수련병원 64%)에서 의원(46%)이나 이차병원(39%)보다 상대적으로 높았다. 인공지능 의료기기 사용 경험이 있는 응답자 중 68% (152명)가 흉부 X선 AI-CAD를 사용한 것으로 확인되었다(9).

식품의약품안전처의 허가와는 별개로, 2023년 말까지 건강보험에 정식으로 등재되어 별도의 수가 보상을 받고 있는 의료 영상 분석 인공지능 의료기기는 아직 없다. 2023년 인공지능 기반 혁신의료기술 건강보험 임시등재 운영 규정이 마련됨에 따라, 식품의약품안전처, 건강보험심사평가원, 한국보건의료연구원의 혁신의료기기 통합심사를 통과한 인공지능 의료기기는 한시적으로 건강보험에 등재되어 수가 보상을 받을 수 있게 되었다(12). 임시등재 기간 동안 해당 사업에 참여하는 의료기관은 인공지능 의료기기 사용에 대한 수가 보상을 청구할 수 있으며, 해당 기간 동안 창출된 안전성 및 유효성에 대한 근거를 바탕으로 건강보험 정식 등재 여부를 평가하게 된다(12). 흉부 X선 AI-CAD 의료기기 1종이 2024년 임시등재 대상에 포함되었다(13).

임상 적용 시의 현실적 고려 사항들

성능 및 유효성 평가

흉부 X선 AI-CAD를 임상 진료에 도입할 것인지, 유사한 기능을 가진 의료기기들 중 어떤 제품을 선택할 것인지 결정함에 있어 다양한 사항들이 고려되어야 한다. 그중 가장 핵심적인 고려 사항은 인공지능 의료기기의 성능(흉부 X선 이상 소견 검출의 정확도)과 유효성(판독 보조 도구로 활용 시 판독 정확도 향상)이 될 것이다. 여러 연구들에서 인공지능의 우수한 성능과 유효성이 이미 보고된 바 있다. 초기 후향적 연구들에서 영상의학과 전문의보다 우수한 인공지능의 검출 성능 및 AI-CAD를 활용한 판독을 통한 판독 수행능 향상이 확인된 이후(4,5,14,15), 건강검진 및 폐암검진 대상자군에서의 폐암 검출(16,17), 응급실 환자군에서의 이상 소견 검출(18), 무증상 수검자에서 활동성 결핵 검출(19,20,21) 등 다양한 진료 상황을 반영한 데이터에서의 우수한 검출 성능을 바탕으로 실제 임상 진료에 적용되기 시작하였다. 실제 임상 진료에 AI-CAD를 적용한 후 평가한 연구들에서도, 건강검진 대상자군에서 폐결절 검출률 향상(22), 폐생검 후 기흉 검출 민감도 향상(23), 암 환자에서의 폐전이 검출률 향상(24) 등 유효성이 확인되었다.

그러나, 환자군과 영상의 특성에 성능이 좌우되는 인공지능의 특성상 실제 임상 적용 시에도 우수한 성능이 재현될지는 확신이 어렵다. 유효성 검증을 위한 연구의 상황과 실제 임상 진료의 상황에서 인공지능 의료기기가 제공하는 결과에 대한 판독의의 태도가 다를 수 있다는 점도 실제 임상 적용 시 유효성을 저하시킬 수 있는 요인이 될 수 있다. 또한, 서로 다른 인공지능 의료기기 간 비교에 대한 정보는 기존의 연구에서는 매우 제한적이다.

따라서, 흉부 X선 AI-CAD 도입 및 임상 적용의 결정에 앞서, 적용 대상 환자군 및 영상의 특성을 적절히 대표할 수 있고, 객관적 성능 평가가 가능한 해당 의료기관의 데이터에서 그 성능 및 유효성을 평가해 보는 것이 필요하다. 인공지능 개발에 사용된 흉부 X선 데이터의 특성과 의료기기를 적용할 흉부 X선 군의 특성 간의 유사성을 살펴보는 것도 성능을 가늠할 수 있는 좋은 방법이겠으나, 이를 위해서는 인공지능 의료기기 제조사의 개발 과정에 대한 투명한 공개가 필요하다(25).

적용 대상 범위 결정

모든 흉부 X선 검사에 AI-CAD를 일괄 적용하는 것이 가장 간단한 결정이겠으나, 적용 대상 환자군에 따라 의료기기의 성능이나 유효성이 달라질 수 있다는 점을 고려하여, 적절한 적용 대상 범위 결정이 이루어져야 한다. 예를 들어, 동일한 AI-CAD를 활용한 임상시험들에서, 건강검진 대상자 군의 경우 폐결절 검출률 향상이 확인되었으나(22), 응급실 급성 흉부 질환 의심 환자군에서는 판독 정확도가 향상되지 않았음이 보고된 바 있다(26). 또한, 이동식 촬영 장비에서 촬영된 영상의 경우 인공지능 의료기기의 위양성 검출이 많음이 알려져 있다(26). 또한, 대다수 AI-CAD들이 주로 성인 환자군에서 개발, 검증되었기 때문에, 소아 환자에서의 성능 및 유효성은 아직 불분명하다(Table 1). 개별 의료기관의 상황을 고려하여 적절한 AI-CAD 적용 대상 설정이 필요하다. 또한, 어떤 임상 상황, 어떤 환자군에 AI-CAD를 활용하는 것이 진단 정확도를 향상시키고, 어떤 상황에서는 그렇지 않은지에 대해서는 앞으로도 지속적인 연구가 필요하다.

분석 결과 공개 범위

흉부 X선 영상을 판독할 충분한 전문 지식이 있고 AI-CAD의 분석 결과를 적절히 해석, 판단할 수 있는 능력이 있는 영상의학과 전문의가 판독 보조도구로 활용하는 것 이외에, 인공지능 검출 보조 의료기기의 분석 결과를 누구에게 공개할 것인지 또한 중요한 결정 요소이다. 흉부 X선 검사를 의뢰한 임상의가 필요한 시점에 영상의학과 전문의의 판독을 제공하는 것이 어려울 수 있다는 점, 흉부 X선 결과를 포함한 다양한 정보를 종합하여 의사결정을 내리는 것은 임상의라는 점을 고려하면 임상의에게 분석 결과를 제공하는 것이 필요하겠고, 인공지능 의료기기를 보조 도구로 활용할 경우 임상의의 판독 수행능 또한 향상될 수 있음이 보고된 바 있다(4,14). 그러나, 인공지능 분석 결과를 적절히 해석할 만한 전문 지식이 상대적으로 부족한 임상의에게 영상의학과 전문의의 판독 없이 인공지능 분석 결과만을 제공할 경우, 자칫 AI-CAD의 오류가 환자에게 악영향을 끼칠 우려가 있다. 따라서, AI-CAD 분석 결과의 의미와 그 해석, AI-CAD가 일으킬 수 있는 오류의 가능성과 대표적인 위양성 및 위음성 검출의 패턴, AI-CAD의 활용 방법 등에 대한 교육을 영상의학과 전문의가 임상의에게 제공할 필요가 있다.

아울러, 전공의 등 피교육자들에게 인공지능 분석 결과를 제공할 것인지에 대한 논의도 필요하다. 흉부 X선 영상에서 이상 소견을 검출하고 이를 적절히 해석하는 것은 영상의학과 전문의의 핵심 역량이며, 이를 습득하기 위해서는 장기간에 걸친 누적된 경험이 필요하다. 이러한 역량을 아직 충분히 함양하지 못한 피교육자들에게 인공지능 분석 결과를 여과 없이 제공할 경우, 인공지능의 오류를 수용하여 잘못된 판독을 할 우려가 있을 뿐 아니라, 흉부 X선 판독 역량 배양에 악영향을 끼칠 가능성 또한 배제할 수 없다. 수련 중 인공지능 의료기기 활용과 판독 수행 역량의 습득 간의 상관관계에 대해서는 아직 밝혀진 바가 없고, 향후 연구가 필요한 분야로 판단된다.

분석 결과 표출

현재 시판되고 있는 AI-CAD 들은 모두 이상 소견이 있을 가능성을 점수 형태로 제공하며, 특정 역치 점수를 넘을 경우 그 위치를 표시하도록 개발되어 있다. 따라서, 역치 점수 값을 결정하는 것이 AI-CAD 활용에 중요한 결정 요소이다. AI-CAD 제조사에서 제공하는 역치 값이 개별 의료기관의 데이터에서도 이상적인 값이 될 수는 없다. 역치 값이 지나치게 높은 경우, 판독 정확도 향상에 도움이 되는 미세한 병변 검출이 불가능하게 되고, 반대로 역치 값이 지나치게 낮은 경우 과도한 위양성 병변 검출로 인하여 판독자의 피로를 야기하거나 실제 판독의 위양성률을 높여 불필요한 추가 검사를 늘릴 우려가 있다. 앞서 언급한 대로 개별 의료기관에서 AI-CAD의 성능을 평가하는 과정에서 적절한 역치 점수 값을 설정하는 것이 필요하다.

또한, AI-CAD 분석 결과의 시각화 방법 또한 고려 사항이다(Figs. 1, 2). 현재 시판 중인 AI-CAD들은 열지도 또는 폐곡선의 형태로 검출한 병변의 위치를 제공하고 있으며, 동일한 분석 결과를 어떻게 시각화하는지에 따라 판독의의 검출 민감도가 달라질 수 있음이 보고된 바 있다. 열지도, 폐곡선, 및 둘의 조합으로 표시되는 AI-CAD 분석 결과를 활용한 판독자 평가에서, 열지도와 폐곡선 모두를 활용한 경우 판독의의 이상 소견 검출 민감도가 가장 높았다(27).

Fig. 1. Example of lung cancer detection on chest X-ray using AI-CAD tool with different methods of visualizing results.

Fig. 1

A. Chest X-ray of a 68-year-old female shows mass opacity at right pulmonary hilum, diagnosed as lung cancer.

B. An AI-CAD tool detected the lesion with a probability score of 94%. The results can be identified on grayscale monitors when visualized using a closed line. The probability score is separately shown.

C. The results are more conspicuous than the closed line when visualized using a heat map, but the results may be invisible on grayscale monitors. The probability score can be visualized using a color scale. Radiologist interpretation may be hindered because the heat map obscures the original X-ray image.

D. Combining the closed line and heat map can merge the strengths of both methods although the amount of information is increased.

AI-CAD = artificial intelligence-based computer-aided detection, Ndl = nodule

Fig. 2. Example of pneumonia detection on chest X-ray using AI-CAD tool with different methods of visualizing results.

Fig. 2

A. Chest X-ray of a 63-year-old female shows focal consolidation at right middle lung field due to pneumonia.

B. An AI-CAD tool detected the lesion with a probability score of 10%. The lesion cannot be detected if the threshold detection score is higher than 10%. The result can be easily identified despite the low probability score when visualized using a closed line.

C. The result cannot be identified because of the low probability score when visualized using a heat map.

D. Using the combination of the closed line and heat map can compensate for the limitations of the heat map.

AI-CAD = artificial intelligence-based computer-aided detection, Csn = consolidation

도입 후 모니터링

AI-CAD의 도입 이후에도 그 성능 및 유효성에 대한 적절한 모니터링은 필수적인데, 시간 경과에 따른 환자군 특성, 영상 특성의 변경이 인공지능의 성능 저하를 일으킬 수 있기 때문이다(28,29). 또한 새로운 기능 도입이나 성능 개선을 위하여 시행된 AI-CAD의 업데이트가 의도치 않게 오히려 성능의 저하를 일으킬 가능성도 배제할 수 없다. 효율적인 인공지능의 모니터링을 위해서는 먼저 적절한 모니터링 지표를 선정해야 한다. 검출 정확도, 양성률, 판독문과의 일치도 등이 지표로 고려될 수 있겠으며, 개별 의료기관의 상황에 따라 활용 가능한 지표는 달라질 수 있다. 주기적인 모니터링 지표 평가를 수행하고, AI-CAD의 성능 저하를 시사하는 지표의 변화가 확인될 경우 그 원인을 파악하고 가능하다면 그 원인을 교정하는 일련의 과정에 대한 적절한 전략이 마련되어야 한다. 환자군 또는 질병의 특성 변화가 성능 저하의 원인인 경우, AI-CAD의 업데이트나 검출 역치 값 조정 등을 통해 성능 개선을 시도해 볼 수 있겠다. 촬영 장비나 촬영 환경 등의 변화에 따른 영상 특성 변화가 원인인 경우, 해당 원인을 적절히 교정해야 하겠으며, 평상시 흉부 X선 영상의 질 관리 또한 중요할 것으로 보인다.

법적 책임 문제

인공지능을 활용한 진료에서 발생할 수 있는 환자에 대한 위해에 대한 불분명한 법적 책임 문제는 인공지능 의료기기의 도입이 확산되는 데에 중요한 장애 요인 중 하나일 수 있다(30). 인공지능 의료기기의 진료 도입이 얼마 되지 않은 현재의 상황에서 구체적인 사례에 근거한 법적 책임 판단은 아직 불가능하다. 현재 시판 중인 AI-CAD 들이 의사의 판독 보조도구로써 승인되어 있으므로, 판독의 결과 환자에게 위해가 발생할 경우 인공지능의 활용이 의사의 법적 책임을 면제하는 근거가 될 수는 없다(6,30). 인공지능 의료기기의 설계 및 개발에 명백한 결함이 있다면 제조물 책임법의 원칙상 의료기기 제조사에게도 법적 책임이 있을 수 있으나(31,32), 구체적인 프로그래밍 없이 대규모 데이터의 학습을 통해서 이루어지는 인공지능 개발의 특성상 설계상의 결함을 입증하기는 어려울 것으로 보인다(30). 마지막으로, 인공지능 의료기기의 관리 및 유지보수 과정에서 발생한 과실로 인하여 환자에 대한 위해가 발생한 경우, 의료기관 및 관리자에게 의료기기 관리에 대한 간접적인 법적 책임이 있을 여지도 있다(30).

판독 보조 도구 이외의 활용 가능성

흉부 X선 AI-CAD를 포함한 다양한 영상 검사에서 이상 소견을 검출하고 진단을 예측하는 인공지능 의료기기들은 현재 모두 의사의 판독을 보조하는 역할로 활용하도록 승인되어 있다(6). 이러한 보수적인 활용 방식은 판독의 정확도를 높이면서도 인공지능의 오류로 인한 환자 위해의 가능성을 최소화할 수 있는 방법이라고 할 수 있으나, 진료의 효율성을 높이거나 의사의 업무 부담을 줄이는 방향으로는 효과를 기대하기 어렵다. AI-CAD의 우수한 검출 성능에 대한 근거가 축적됨에 따라, 판독 보조 도구 이외의 활용 방안에 대한 논의가 필요한 시점이다.

판독의의 개입 없이 영상 촬영 직후 자동 분석이 가능한 이점을 활용한다면, 즉각적인 조치가 필요한 질환 또는 이상 소견이 있는 검사를 자동으로 선별하여 판독 우선순위를 부여하는 도구로써 인공지능을 활용할 수 있다. 이러한 인공지능 기반 우선판독에 대한 연구는 뇌 CT에서 두개강 내출혈을 검출하는 인공지능을 대상으로 가장 널리 이루어지고 있고, 우선 판독 시스템 적용 후 두개강 내 출혈을 동반한 CT에 대한 판독 소요시간 단축이 보고된 바 있다(33). 흉부 X선의 경우 기흉, 기복증, 기관 내 튜브를 포함한 의료 장비의 잘못된 위치 등이 이러한 우선 판독의 대상이 될 수 있겠다(15,34). 후향적 연구들에서 인공지능 기반 우선판독을 통한 즉각적인 조치가 필요한 소견을 동반한 검사에 대한 판독 소요시간 단축의 가능성을 보고하였으나(15,35), 실제 진료 상황에서 우선 판독이 효과적으로 작동하는지 확인을 위해서는 향후 전향적 연구가 필요할 것으로 보인다.

검사 수의 빠른 증가에 따른 판독의의 과도한 업무부담 및 이로 인한 판독의의 소진(36), AI-CAD의 다양한 이상 소견에 대한 우수한 민감도를 고려할 때, 정상 흉부 X선 영상에 대한 자동 선별 및 판독 또한 매력적인 시나리오가 될 수 있다(7). 후향적 연구에서 이미 인공지능이 정상 흉부 X선 영상을 효과적으로 분류할 수 있음이 보고된 바 있으나(37,38), 실제 임상 진료 상황에서 인공지능 분석 결과에 따라 의사의 판독을 생략하는 것에 대해서는 논의가 더 필요할 것으로 보인다.

ChatGPT와 같은 대형 언어 모델로 대표되는 기초 모델 기반의 거대 생성형 인공지능 기술 또한 흉부 X선 영역에 적용할 수 있을 것으로 기대된다. 이러한 최신의 인공지능 모델은 막대한 데이터를 통하여 학습되어 다양한 목적으로 활용이 가능하고, 영상뿐만 아니라 자연어 등 다양한 형태의 정보를 동시에 효과적으로 처리 가능하며, 단순 예측을 넘어 새로운 정보를 생성할 수 있다는 강점이 있다(39,40,41). 이를 흉부 X선 영역에 활용한다면, 영상으로부터 판독소견서 생성, 의무기록을 고려한 영상 평가 등 기존의 인공지능이 수행할 수 없었던 일들을 수행할 수 있을 것으로 기대된다. 이전 흉부 X선 검사와의 비교를 통한 변화의 평가 또한 기존의 AI-CAD들이 처리하지 못하는 영역으로 앞으로 연구가 더 필요하다(42).

결론

흉부 X선 AI-CAD의 성능 및 유효성에 대한 근거는 이제 확고한 것으로 보이고, 임상 진료 도입이 활발히 이루어지고 있을 뿐 아니라 당분간 임상 적용이 점차 확대될 것으로 예상된다. 앞서 언급하였듯이, AI-CAD의 임상 진료 도입에 있어서는 여러 현실적인 문제들에 대한 고려가 필요하고, 개별 의료기관의 상황에 따라 적절한 의사 결정이 필요하다. AI-CAD를 안전하고 효율적으로 도입, 운영하기 위해서는 영상 판독 및 인공지능 의료기기에 대한 전문 지식을 갖춘 영상의학과 전문의의 적극적인 역할이 필수적이다.

마지막으로, 환자의 복리와 안전이라는 의료의 궁극적인 가치에 인공지능 의료기기가 기여할 수 있도록 노력하는 것 또한 영상의학과 전문의의 중요한 역할일 것이다. 이를 위해서, 판독 보조 도구로서의 인공지능을 넘어 인공지능의 가치를 극대화할 수 있는 적응증 및 활용 방법에 대한 지속적인 논의와 연구가 필요하겠다.

Footnotes

Conflicts of Interest: The author reports research grants from Lunit, Coreline soft, and Monitor corporation, outside the present manuscript.

Funding: None

References

  • 1.Ehteshami Bejnordi B, Veta M, Johannes van Diest P, van Ginneken B, Karssemeijer N, Litjens G, et al. Diagnostic assessment of deep learning algorithms for detection of lymph node metastases in women with breast cancer. JAMA. 2017;318:2199–2210. doi: 10.1001/jama.2017.14585. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 2.Esteva A, Kuprel B, Novoa RA, Ko J, Swetter SM, Blau HM, et al. Dermatologist-level classification of skin cancer with deep neural networks. Nature. 2017;542:115–118. doi: 10.1038/nature21056. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 3.Gulshan V, Peng L, Coram M, Stumpe MC, Wu D, Narayanaswamy A, et al. Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs. JAMA. 2016;316:2402–2410. doi: 10.1001/jama.2016.17216. [DOI] [PubMed] [Google Scholar]
  • 4.Hwang EJ, Park S, Jin KN, Kim JI, Choi SY, Lee JH, et al. Development and validation of a deep learning-based automated detection algorithm for major thoracic diseases on chest radiographs. JAMA Netw Open. 2019;2:e191095. doi: 10.1001/jamanetworkopen.2019.1095. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 5.Nam JG, Park S, Hwang EJ, Lee JH, Jin KN, Lim KY, et al. Development and validation of deep learning-based automatic detection algorithm for malignant pulmonary nodules on chest radiographs. Radiology. 2019;290:218–228. doi: 10.1148/radiol.2018180237. [DOI] [PubMed] [Google Scholar]
  • 6.Hwang EJ, Goo JM, Yoon SH, Beck KS, Seo JB, Choi BW, et al. Use of artificial intelligence-based software as medical devices for chest radiography: a position paper from the Korean Society of Thoracic Radiology. Korean J Radiol. 2021;22:1743–1748. doi: 10.3348/kjr.2021.0544. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 7.Hwang EJ, Park CM. Clinical implementation of deep learning in thoracic radiology: potential applications and challenges. Korean J Radiol. 2020;21:511–525. doi: 10.3348/kjr.2019.0821. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 8.Ministry of Food and Drug Safety. Medical device safety library. [Accessed June 14, 2024]. Available at. https://emedi.mfds.go.kr/search/data/MNU20237 .
  • 9.Hwang EJ, Park JE, Song KD, Yang DH, Kim KW, Lee JG, et al. 2023 survey on user experience of artificial intelligence software in radiology by the Korean Society of Radiology. Korean J Radiol. 2024;25:613–622. doi: 10.3348/kjr.2023.1246. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 10.Allen B, Agarwal S, Coombs L, Wald C, Dreyer K. 2020 ACR data science institute artificial intelligence survey. J Am Coll Radiol. 2021;18:1153–1159. doi: 10.1016/j.jacr.2021.04.002. [DOI] [PubMed] [Google Scholar]
  • 11.European Society of Radiology (ESR) Current practical experience with artificial intelligence in clinical radiology: a survey of the European Society of Radiology. Insights Imaging. 2022;13:107. doi: 10.1186/s13244-022-01247-y. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 12.Health Insurance Review and Assessment Service. Release of guideline for health insurance registration of digital treatment devices and artificial intelligence (AI) [Published 2023]. [Accessed April 12, 2024]. Available at. https://www.hira.or.kr/bbsDummy.do?pgmid=HIRAA020041000100&brdScnBltNo=4&brdBltNo=10957&pageIndex=1&pageIndex2=1 .
  • 13.Lunit Inc. Lunit INSIGHT CXR cleared approval as innovative medical technology. [Published 2023]. [Accessed April 12, 2024]. Available at. https://innovativecxr.lunit.io .
  • 14.Hwang EJ, Park S, Jin KN, Kim JI, Choi SY, Lee JH, et al. Development and validation of a deep learning-based automatic detection algorithm for active pulmonary tuberculosis on chest radiographs. Clin Infect Dis. 2019;69:739–747. doi: 10.1093/cid/ciy967. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 15.Nam JG, Kim M, Park J, Hwang EJ, Lee JH, Hong JH, et al. Development and validation of a deep learning algorithm detecting 10 common abnormalities on chest radiographs. Eur Respir J. 2021;57:2003061. doi: 10.1183/13993003.03061-2020. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 16.Lee JH, Sun HY, Park S, Kim H, Hwang EJ, Goo JM, et al. Performance of a deep learning algorithm compared with radiologic interpretation for lung cancer detection on chest radiographs in a health screening population. Radiology. 2020;297:687–696. doi: 10.1148/radiol.2020201240. [DOI] [PubMed] [Google Scholar]
  • 17.Yoo H, Kim KH, Singh R, Digumarthy SR, Kalra MK. Validation of a deep learning algorithm for the detection of malignant pulmonary nodules in chest radiographs. JAMA Netw Open. 2020;3:e2017135. doi: 10.1001/jamanetworkopen.2020.17135. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 18.Hwang EJ, Nam JG, Lim WH, Park SJ, Jeong YS, Kang JH, et al. Deep learning for chest radiograph diagnosis in the emergency department. Radiology. 2019;293:573–580. doi: 10.1148/radiol.2019191225. [DOI] [PubMed] [Google Scholar]
  • 19.Gelaw SM, Kik SV, Ruhwald M, Ongarello S, Egzertegegne TS, Gorbacheva O, et al. Diagnostic accuracy of three computer-aided detection systems for detecting pulmonary tuberculosis on chest radiography when used for screening: analysis of an international, multicenter migrants screening study. PLOS Glob Public Health. 2023;3:e0000402. doi: 10.1371/journal.pgph.0000402. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 20.Kagujje M, Kerkhoff AD, Nteeni M, Dunn I, Mateyo K, Muyoyeta M. The performance of computer-aided detection digital chest X-ray reading technologies for triage of active tuberculosis among persons with a history of previous tuberculosis. Clin Infect Dis. 2023;76:e894–e901. doi: 10.1093/cid/ciac679. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 21.Qin ZZ, Ahmed S, Sarker MS, Paul K, Adel ASS, Naheyan T, et al. Tuberculosis detection from chest X-rays for triaging in a high tuberculosis-burden setting: an evaluation of five artificial intelligence algorithms. Lancet Digit Health. 2021;3:e543–e554. doi: 10.1016/S2589-7500(21)00116-3. [DOI] [PubMed] [Google Scholar]
  • 22.Nam JG, Hwang EJ, Kim J, Park N, Lee EH, Kim HJ, et al. AI improves nodule detection on chest radiographs in a health screening population: a randomized controlled trial. Radiology. 2023;307:e221894. doi: 10.1148/radiol.221894. [DOI] [PubMed] [Google Scholar]
  • 23.Hong W, Hwang EJ, Lee JH, Park J, Goo JM, Park CM. Deep learning for detecting pneumothorax on chest radiographs after needle biopsy: clinical implementation. Radiology. 2022;303:433–441. doi: 10.1148/radiol.211706. [DOI] [PubMed] [Google Scholar]
  • 24.Hwang EJ, Lee JS, Lee JH, Lim WH, Kim JH, Choi KS, et al. Deep learning for detection of pulmonary metastasis on chest radiographs. Radiology. 2021;301:455–463. doi: 10.1148/radiol.2021210578. [DOI] [PubMed] [Google Scholar]
  • 25.Mongan J, Moy L, Kahn CE., Jr Checklist for artificial intelligence in medical imaging (CLAIM): a guide for authors and reviewers. Radiol Artif Intell. 2020;2:e200029. doi: 10.1148/ryai.2020200029. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 26.Hwang EJ, Goo JM, Nam JG, Park CM, Hong KJ, Kim KH. Conventional versus artificial intelligence-assisted interpretation of chest radiographs in patients with acute respiratory symptoms in emergency department: a pragmatic randomized clinical trial. Korean J Radiol. 2023;24:259–270. doi: 10.3348/kjr.2022.0651. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 27.Hong S, Hwang EJ, Kim S, Song J, Lee T, Jo GD, et al. Methods of visualizing the results of an artificial-intelligence-based computer-aided detection system for chest radiographs: effect on the diagnostic performance of radiologists. Diagnostics (Basel) 2023;13:1089. doi: 10.3390/diagnostics13061089. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 28.Allen B, Dreyer K, Stibolt R, Jr, Agarwal S, Coombs L, Treml C, et al. Evaluation and real-world performance monitoring of artificial intelligence models in clinical practice: try it, buy it, check it. J Am Coll Radiol. 2021;18:1489–1496. doi: 10.1016/j.jacr.2021.08.022. [DOI] [PubMed] [Google Scholar]
  • 29.Brady AP, Allen B, Chong J, Kotter E, Kottler N, Mongan J, et al. Developing, purchasing, implementing and monitoring AI tools in radiology: practical considerations. A multi-society statement from the ACR, CAR, ESR, RANZCR & RSNA. J Am Coll Radiol. 2024 Jan 23; doi: 10.1016/j.jacr.2023.12.005. [Epub] [DOI] [PubMed] [Google Scholar]
  • 30.Mello MM, Guha N. Understanding liability risk from using health care artificial intelligence tools. N Engl J Med. 2024;390:271–278. doi: 10.1056/NEJMhle2308901. [DOI] [PubMed] [Google Scholar]
  • 31.Jaremko JL, Azar M, Bromwich R, Lum A, Alicia Cheong LH, Gibert M, et al. Canadian Association of Radiologists white paper on ethical and legal issues related to artificial intelligence in radiology. Can Assoc Radiol J. 2019;70:107–118. doi: 10.1016/j.carj.2019.03.001. [DOI] [PubMed] [Google Scholar]
  • 32.Mezrich JL. Is artificial intelligence (AI) a pipe dream? Why legal issues present significant hurdles to AI autonomy. AJR Am J Roentgenol. 2022;219:152–156. doi: 10.2214/AJR.21.27224. [DOI] [PubMed] [Google Scholar]
  • 33.O’Neill TJ, Xi Y, Stehel E, Browning T, Ng YS, Baker C, et al. Active reprioritization of the reading worklist using artificial intelligence has a beneficial effect on the turnaround time for interpretation of head CT with intracranial hemorrhage. Radiol Artif Intell. 2020;3:e200024. doi: 10.1148/ryai.2020200024. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 34.An JY, Hwang EJ, Nam G, Lee SH, Park CM, Goo JM, et al. Artificial intelligence for assessment of endotracheal tube position on chest radiographs: validation in patients from two institutions. AJR Am J Roentgenol. 2024;222:e2329769. doi: 10.2214/AJR.23.29769. [DOI] [PubMed] [Google Scholar]
  • 35.Baltruschat I, Steinmeister L, Nickisch H, Saalbach A, Grass M, Adam G, et al. Smart chest X-ray worklist prioritization using artificial intelligence: a clinical workflow simulation. Eur Radiol. 2021;31:3837–3845. doi: 10.1007/s00330-020-07480-7. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 36.Koo HJ, Do KH. The staffing crisis and burnout in academic radiology: insights from a survey study in Korea. J Am Coll Radiol. 2024;21:505–514. doi: 10.1016/j.jacr.2023.08.046. [DOI] [PubMed] [Google Scholar]
  • 37.Plesner LL, Müller FC, Nybing JD, Laustrup LC, Rasmussen F, Nielsen OW, et al. Autonomous chest radiograph reporting using AI: estimation of clinical impact. Radiology. 2023;307:e222268. doi: 10.1148/radiol.222268. [DOI] [PubMed] [Google Scholar]
  • 38.Yoo H, Kim EY, Kim H, Choi YR, Kim MY, Hwang SH, et al. Artificial intelligence-based identification of normal chest radiographs: a simulation study in a multicenter health screening cohort. Korean J Radiol. 2022;23:1009–1018. doi: 10.3348/kjr.2022.0189. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 39.Jung KH. Uncover this tech term: foundation model. Korean J Radiol. 2023;24:1038–1041. doi: 10.3348/kjr.2023.0790. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 40.Fei N, Lu Z, Gao Y, Yang G, Huo Y, Wen J, et al. Towards artificial general intelligence via a multimodal foundation model. Nat Commun. 2022;13:3094. doi: 10.1038/s41467-022-30761-2. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 41.Huang J, Neill L, Wittbrodt M, Melnick D, Klug M, Thompson M, et al. Generative artificial intelligence for chest radiograph interpretation in the emergency department. JAMA Netw Open. 2023;6:e2336100. doi: 10.1001/jamanetworkopen.2023.36100. [DOI] [PMC free article] [PubMed] [Google Scholar]
  • 42.Yun J, Ahn Y, Cho K, Oh SY, Lee SM, Kim N, et al. Deep learning for automated triaging of stable chest radiographs in a follow-up setting. Radiology. 2023;309:e230606. doi: 10.1148/radiol.230606. [DOI] [PubMed] [Google Scholar]

Articles from Journal of the Korean Society of Radiology are provided here courtesy of Korean Society of Radiology

RESOURCES