獨逸 쾰른大學病院
人工知能이 映像診斷의 效率性을 높일 것으로 期待된다. IM3_vs10/게티이미지뱅크 提供.
오픈AI의 大型言語모델(LLM)인 GPT-4街 映像醫學科 專門醫만큼 放射線學 診斷 記錄의 誤謬를 感知하는 能力이 있는 것으로 確認됐다. 映像醫學科에서 작업 處理 速度를 높이는 데 活用될 수 있을 것으로 展望된다.
로만 J. 게르츠 獨逸 쾰른大學病院 映像醫學科 醫學博士 硏究팀은 GPT-4와 映像醫學科 專門醫의 放射線學 診斷 記錄에 對한 誤謬 檢出率이 類似하다는 硏究結果를 國際學術誌 '放射線學'에 16日(現地時間) 發表했다. 방사선학 診斷 記錄의 誤謬 檢出에서 GPT-4 性能과 人間의 能力을 比較한 硏究는 이番이 처음이다.
放射線學 記錄의 誤謬는 專攻醫와 專門醫 間의 判斷 不一致, 音聲認識 不正確性, 作業 部下 等으로 인해 發生할 수 있다. 硏究팀은 GPT-4와 같은 LLM을 통해 診療 記錄 生成 프로세스를 向上시킬 수 있을 것으로 보았다.
診斷 記錄과 關聯한 LLM의 潛在力은 앞선 硏究들을 통해서도 確認됐다. 患者의 兵力을 基盤으로 올바른 映像 檢査를 選擇하도록 誘導하고, 敍述形으로 自由롭게 記述된 患者 記錄을 짜임새 있는 記錄으로 變換하는 等의 潛在的 可能性을 보여왔다.
硏究팀은 正確性, 速度, 費用 效率 側面에서 GPT-4 性能과 人間 能力을 比較했다. 우선 2023年 6月에서 12月 單一機關에서 蒐集한 엑스線, 컴퓨터單層撮影(CT) 및 磁氣共鳴映像(MRI) 等 200個의 放射線學 診斷 記錄을 蒐集한 다음 100個의 記錄에 漏落, 揷入, 綴字法 等과 關聯한 誤謬 150個를 意圖的으로 집어넣었다.
그런 뒤 시니어 映像醫學科 專門醫 2名, 主治醫 2名, 專攻醫 2名과 GPT-4에게 放射線學 診斷 記錄의 誤謬를 感知하는 課題를 施行하도록 했다.
그 結果 主治醫와 專攻醫의 誤謬 檢出率은 80%, 시니어 專門醫의 檢出率은 89.3%, GPT-4의 검츌률은 82.7%로 나타났다. GPT-4는 診斷 經驗이 가장 豐富한 시니어 專門醫보다는 檢出 能力이 떨어졌지만 主治醫 및 專攻醫와는 별다른 能力 差異를 보이지 않은 셈이다.
GPT-4는 診療 記錄黨 處理 時間이 사람보다 적게 所要됐고 잘못된 部分을 矯正하는 修正 費用도 더 적게 들어갔다. 게르츠 博士는 “誤謬를 感知하는 GPT-4의 效率性은 AI가 映像醫學科 作業 흐름을 最適化하는 데 도움이 될 수 있다는 點을 暗示한다”며 “適時에 信賴度 높은 診斷을 提供하는 力量이 向上되는 데 도움이 될 것으로 보인다”고 말했다.
또 “우리 硏究는 AI가 誤謬를 最少化하면서 病院 運營 및 醫療 費用을 낮추는 醫療 革新을 일으킬 수 있다는 具體的인 事例”라며 “放射線學 記錄의 正確度가 높아지면 患者는 適切한 治療를 받을 수 있는 機會가 늘어나게 된다”고 덧붙였다.