CoBoL's Blog: Nature Medicine：醫學AI—請拿出醫學價值的證據！

Nature Medicine: Show us the evidence for the value of medical AI

中國醫藥大學安南醫院副院長

精神醫學及神經科學特聘教授

2026年4月21日，Nature Medicine發表了一篇題為：Show us the evidence for the value of medical AI 的文章，指出「醫學 AI 的推廣速度遠快於其臨床價值證據的累積速度」、「AI正在宣稱可以改善醫療，但沒有基於切實可靠的臨床試驗證據」！呼籲醫學AI領域構建一個類似藥物研發「I-IV期臨床試驗」的證據等級系統，將醫學AI的研發重心從「模型能否做」徹底轉向是否有「臨床應用的效果和價值」。

Editorial: Show us the evidence for the value of medical AI. Nat Med. 2026 Apr;32(4):1163.

近年Artificial Intelligence（AI）快速進入醫療照護領域，從P預測模型（predictive models）、臨床決策支持工具（decision support tools）及生成式工具 Large Language Models（LLMs）等醫療 AI 系統，幾乎所有醫療場域皆開始導入AI。然而，Nature Medicine本篇Editorial提出一項重要警訊：AI技術快速成長，但真正證明能改善病人照護（Clinical impact）的高品質證據仍相當不足。這種實證不對稱的現狀，不僅帶來科學上的不確定性，更導致了許多未成熟技術的過早引進（premature adoption）。

目前多數醫療 AI 領域過度依賴傳統的統計指標（statistical metrics），例如區別度（discrimination）、校準度（calibration）、敏感度（sensitivity）與特異度（specificity）。然而，這些統計指標大多數是相關性的驗証，本身並不能與臨床影響力（clinical impact）或因果關係劃上等號。在回顧性驗證（retrospective validation）中獲得極高精準度的模型，一旦引入真實的臨床環境，若其控制情境不同、缺乏可解釋性機轉（interpretable），或與現行臨床工作流程（clinical workflows）有異，不但無法改善照護品質，甚至可能引發非預期傷害（unintended consequences）。許多病患使用AI進行詢商會談而造成不利的結果，或者延誤就醫，就是無法避免的負面影響。

Medical AI真正需要的不只是更好的技術，而是更好的證據 (Evidence)

現行醫療 AI 的監管框架（regulatory frameworks）與實施決策（implementation decisions），往往在核心的可操作性（actionability）、可行性（feasibility）與安全性得到充分解決前就已做出，這使得多數醫療機構的決策流於早期採用的熱情，而非建構在一致的實證基礎上。作者進一步比較藥物臨床試驗與醫療 AI的差異。藥物上市需歷經Phase I–III試驗及主管機關審查，而醫療 AI尚缺乏一致性的Evidence Framework，使許多產品在缺乏臨床實驗證據下即快速進入市場。

為導正此一趨勢，發展一個將臨床宣稱與合適、成比例證據（proportional evidence）相連結的評估框架已迫在眉睫。此框架的核心精神在於「宣稱越強，支持其論點的證據就必須越強」。針對不同的臨床宣稱，AI 必須提出相對應的實證支持：分析性能宣稱（analytic performance claims）需在特定群體中進行強大驗證；工作流程效益宣稱（Workflow claims）須透過實施研究（implementation studies）證明不增加醫療負擔；而最高層級的預後與效率改善宣稱（Clinical outcomes & Healthcare efficiency claims），則必須訴諸前瞻性證據（prospective study）並與照護標準進行對照（Comparative study）。

值得注意的是，作者並未主張所有AI皆須完成Randomized Controlled Trial（RCT），而是認為應依AI用途及宣稱程度採取比例性證據。更重要的是監管機構應釐清分級標準，醫療行政管理者應將試點實施（pilot implementation）與效益實證區分，而學術期刊則需嚴格把關，確保發表的研究反映的是真實的臨床價值而非單純的技術承諾。同時，由於AI模型會持續更新，Post-deployment monitoring亦應成為醫療機構的基本要求。唯有當宣稱與證據形成緊密的理性連結，醫療 AI 才能真正落實其改善照護品質的終極承諾。

轉譯研究 (Translational Research) 是臨床醫療的靈魂

長期以來，我一直深信「轉譯研究 (Translational Research)」是臨床醫療的靈魂。從當年我們投入 Omega-3 在憂鬱症的研究，面對當時醫學界對營養介入的質疑，到後來透過嚴謹的隨機對照試驗 (RCT) 建立臨床指引，這段 25 年的歷程教會我一件事：無論科技如何演進，醫學的「證據 (Evidence)」永遠是不可動搖的基石。

這正是目前 medical AI 最缺乏的環節：市場上有越來越多 AI products，但真正經過 clinical validation、safety confirmation 與 real-world implementation evaluation 的工具仍然有限。AI 雖強大，但市場上的醫療 AI 工具往往缺乏足夠的臨床實證。這與當年我們推動 Omega-3 時的困境如出一轍—技術不難，難的是如何透過設計嚴謹的臨床研究，證明其安全性與療效。

而這正是 MBI Lab & Care 團隊的核心優勢！台灣有能力收集「前瞻性、嚴謹設計、精準控制條件」大數據的臨床研究團隊，結合高度研發能量的頂尖產業團隊，一起投入跨領域的合作，才能會讓medical AI的相關成果或產品有更高的競爭優勢。

CoBoL's Blog

03/07/2026

Nature Medicine：醫學AI—請拿出醫學價值的證據！

No comments:

Post a Comment