Nature Medicine: Show us the evidence for the value of medical AI
中國醫藥大學 安南醫院副院長
精神醫學及神經科學 特聘教授
近年Artificial Intelligence(AI)快速進入醫療照護領域,從P預測模型(predictive models)、臨床決策支持工具(decision support tools)及生成式工具 Large Language Models(LLMs)等醫療 AI 系統,幾乎所有醫療場域皆開始導入AI。然而,Nature Medicine本篇Editorial提出一項重要警訊:AI技術快速成長,但真正證明能改善病人照護(Clinical impact)的高品質證據仍相當不足。這種實證不對稱的現狀,不僅帶來科學上的不確定性,更導致了許多未成熟技術的過早引進(premature adoption)。
目前多數醫療 AI 領域過度依賴傳統的統計指標(statistical metrics),例如區別度(discrimination)、校準度(calibration)、敏感度(sensitivity)與特異度(specificity)。然而,這些統計指標大多數是相關性的驗証,本身並不能與臨床影響力(clinical impact)或因果關係劃上等號。在回顧性驗證(retrospective validation)中獲得極高精準度的模型,一旦引入真實的臨床環境,若其控制情境不同、缺乏可解釋性機轉(interpretable),或與現行臨床工作流程(clinical workflows)有異,不但無法改善照護品質,甚至可能引發非預期傷害(unintended consequences)。許多病患使用AI進行詢商會談而造成不利的結果,或者延誤就醫,就是無法避免的負面影響。
Medical AI真正需要的不只是更好的技術,而是更好的證據 (Evidence)
現行醫療 AI 的監管框架(regulatory frameworks)與實施決策(implementation decisions),往往在核心的可操作性(actionability)、可行性(feasibility)與安全性得到充分解決前就已做出,這使得多數醫療機構的決策流於早期採用的熱情,而非建構在一致的實證基礎上。作者進一步比較藥物臨床試驗與醫療 AI的差異。藥物上市需歷經Phase I–III試驗及主管機關審查,而醫療 AI尚缺乏一致性的Evidence Framework,使許多產品在缺乏臨床實驗證據下即快速進入市場。
為導正此一趨勢,發展一個將臨床宣稱與合適、成比例證據(proportional evidence)相連結的評估框架已迫在眉睫。此框架的核心精神在於「宣稱越強,支持其論點的證據就必須越強」。針對不同的臨床宣稱,AI 必須提出相對應的實證支持:分析性能宣稱(analytic performance claims)需在特定群體中進行強大驗證;工作流程效益宣稱(Workflow claims)須透過實施研究(implementation studies)證明不增加醫療負擔;而最高層級的預後與效率改善宣稱(Clinical outcomes & Healthcare efficiency claims),則必須訴諸前瞻性證據(prospective study)並與照護標準進行對照(Comparative study)。
值得注意的是,作者並未主張所有AI皆須完成Randomized Controlled Trial(RCT),而是認為應依AI用途及宣稱程度採取比例性證據。更重要的是監管機構應釐清分級標準,醫療行政管理者應將試點實施(pilot implementation)與效益實證區分,而學術期刊則需嚴格把關,確保發表的研究反映的是真實的臨床價值而非單純的技術承諾。同時,由於AI模型會持續更新,Post-deployment monitoring亦應成為醫療機構的基本要求。唯有當宣稱與證據形成緊密的理性連結,醫療 AI 才能真正落實其改善照護品質的終極承諾。
轉譯研究 (Translational Research) 是臨床醫療的靈魂
長期以來,我一直深信「轉譯研究 (Translational Research)」是臨床醫療的靈魂。從當年我們投入 Omega-3 在憂鬱症的研究,面對當時醫學界對營養介入的質疑,到後來透過嚴謹的隨機對照試驗 (RCT) 建立臨床指引,這段 25 年的歷程教會我一件事:無論科技如何演進,醫學的「證據 (Evidence)」永遠是不可動搖的基石。
這正是目前 medical AI 最缺乏的環節:市場上有越來越多 AI products,但真正經過 clinical validation、safety confirmation 與 real-world implementation evaluation 的工具仍然有限。AI 雖強大,但市場上的醫療 AI 工具往往缺乏足夠的臨床實證。這與當年我們推動 Omega-3 時的困境如出一轍——技術不難,難的是如何透過設計嚴謹的臨床研究,證明其安全性與療效。
而這正是 MBI Lab & Care 團隊的核心優勢!台灣有能力收集「前瞻性、嚴謹設計、精準控制條件」大數據的臨床研究團隊,結合高度研發能量的頂尖產業團隊,一起投入跨領域的合作,才能會讓medical AI的相關成果或產品有更高的競爭優勢。

No comments:
Post a Comment