巨大規模的研究,為何還是偵測不到複雜疾病中的治療或預防效果?
蘇冠賓
中國醫藥大學 醫學院副院長
精神醫學及神經科學教授
身心介面實驗室主持人
台灣營養精神醫學研究學會 理事長
本文的目的是要解釋,研究者如果想要証明「單一治療對複雜疾病有效」是困難的;反之,想要証明「無效性」是非常容易的,因為治療和安慰劑的差異量很小,任何試驗上的瑕疵都可以讓微弱的差異被遺漏。重點是:(1)對於「治療有效的個案,千萬別因為一些研究結果無效的報導,輕易停止自己合適的治療」;(2)不要「因為一些研究証實某項治療有效,就過度樂觀地轉換過去不見得合適自己的治療」;(3)不要為了單一療法花費大量時間和金錢。
紐約時報在2015年3月30日有一篇專題報導(註一),提到大多數有關魚油的臨床試驗都未發現任何證據,足以證明魚油對心肌梗塞和中風有預防的效果,同樣的結論,也出現在憂鬱症預防的研究中(註二)。從科學理論及另一些臨床試驗上,有很多証據使人相信魚油可以改善心血管疾病及憂鬱症,然而,研究為何偵測不到魚油預防疾病的效果?
首先我們要了解,「魚油對某些患者是有效的,對另外一些則是無效的」。由於心血管疾病及憂鬱症的複雜性及異質性,所有憂鬱症「治療」(包括藥物或心理治療)的療效效應空間(effect size)相當有限,必須要有大規模的雙盲、安慰劑對照組的臨床試驗,才能偵測出微弱的統計顯著性。以藥物治療做為例子,根據2015年4月30日出版的「自然」雜誌報導(註三),和安慰劑比較之下,美國目前銷售額最好的第一線抗憂症藥物duloxetine,要治療九位病人,才能產生一位病人的療效差異性(Number Needed to Treat,
NNT=9),所以如果要偵測到這麼小的「訊號」,就要有很好的科學家,設計非常嚴謹的臨床試驗,然後要收集數以百計的病患,才能在成功証實抗憂症藥物和安慰劑的統計差異(有效)。也就是說:「研究者如果想要証明治療無效反而非常容易(因為差異量很小),任何試驗上的瑕疵都可以讓微弱的差異被遺漏」。
另外在許多研究中,為了方便收案而「沒有採用標準的診斷流程」,只用自填量表呈現分數的低或高分,其結果並不能等同於精神病理的有無,這在精神醫學研究的可信度上常常會被質疑。另外像是研究使用的「劑量與配方的問題」;以及「憂鬱評估並非研究設計主要標的 (Type I error)」…等等,這些都是巨大規模的研究偵測不到複雜疾病中的治療或預防效果的可能原因 。
此外,在「健康人」施於「預防性介入」的實驗,恐怕沒有足夠病理標的可以矯正(因為尚未發病),不要說魚油研究偵測不到預防疾病的效果,就算是藥物介入,不僅仍然偵測不到預防效果,恐怕因為藥物的副作用,而使服藥者反而比服安慰者出現更差的結果。
附註:
1. Fish Oil Claims Not Supported by Research (By ANAHAD O'CONNOR, MARCH 30, 2015, http://well.blogs.nytimes.com/2015/03/30/fish-oil-claims-not-supported-by-research)
2. Fish Oil: 'No Net Benefit' for Depression Prevention?By Megan Brooks December 21, 2021, https://www.medscape.com/viewarticle/965265
1. Fish Oil Claims Not Supported by Research (By ANAHAD O'CONNOR, MARCH 30, 2015, http://well.blogs.nytimes.com/2015/03/30/fish-oil-claims-not-supported-by-research)
2. Fish Oil: 'No Net Benefit' for Depression Prevention?By Megan Brooks December 21, 2021, https://www.medscape.com/viewarticle/965265
3. Schork NJ. Personalized medicine: Time for one-person trials. Nature. 2015 Apr 30;520:609-11
為什麼比起數據,人們更容易相信個案?
ReplyDeletehttps://pansci.asia/archives/146851
2018/10/11|活得科學社會群體科學傳播精神心理|
標籤:個案數據決策科學思辨力科學素養
社會中總會有許多來來去去的科學議題,從基改、食安到能源議題,每一個都能看到正反兩方戰到天荒地老。一方總是主要訴諸理性/科學/數據,另一方則是走感性/案例/經驗的路線。
這類的爭議總是來來去去,理性方每每準備好詳盡的數據與論述來回應,感性方則是以打動人心的故事來說服大眾。一兩則個案並不能代表什麼,大範圍的抽樣才有可信度才對啊。很多理性方的人不懂,明明證據都擺在眼前,為何就是有那麼多人不願意接受。
在指責他人沒知識或不理性之前,或許可以先瞭解一些心理學,知己知彼才能百戰百勝。直接講結論就是,人天生傾向於接受個案而不是數據。
不管數據說什麼,個案就是能說服你
有個實驗很有意思,研究找了 317 位大學生,聲稱研發了一個新藥,要請他們評估願不願意使用這個藥物。告知方法會說明這個藥物的成功率經臨床測試的成功率是多少(90%, 70%, 50%, 30%),同時也會講一位個案接受藥物後的情況,個案情況有成功也有失敗也有不確定。個案的說明內容大致如下:
個案情況良好:小強使用這個藥物後成效良好,病毒都被清除了,醫師認為病情不會再復發。治療完一個月後情況良好。
個案情況不佳:小強使用這個藥物後成效不好,病毒並沒有完全被清除,醫師認為病情還在持續。治療完一個月後小強失明了且失去行走的能力。
個案情況不確定:小強不確定使用藥物的選擇是不是對的,醫生也無法確定病毒是否都被清除了,同時也不肯定病情是否還會持續。治療完一個月後小強的情況時好時壞。
每位都會閱讀到關於此藥物的成功率以及一位個案使用的情況。為了避免先後順序的影響,有一半的人會先被告知成功率後再知道個案,另一半的人則相反。理論上要不要服藥應該著重於藥物的成功率,畢竟這是經過臨床驗證來的,個案因為只有一個很難做得準。
但是結果發現:
同樣是告知有 90% 成功率的藥物,後面加上失敗的案例的話,人們接受的程度就會由 88% 銳減為 39%,相當驚人的差異。而更有意思的是,同樣是告知成功率只有 30%,若加上一個失敗的案例,那麼接受程度只有 7%,但若是加上成功案例的話,接受程度會爆增到 78%!
我把兩個比較極端的例子獨立出來:
90% 成功率+失敗案例 = 39% 接受度
30% 成功率+成功案例 = 78% 接受度
看到上表數據就知道,個案的成功與否影響接受度非常大啊!幾乎是只要有成功個案就很容易接受、個案失敗就很難接受。
這樣數據派根本就是全面潰敗啊,雖然可以打臉打得很爽,但就是不容易說服人接受。
為什麼會這樣呢?我們來假想一個情況:
如果要你對一個不識字、不懂統計學概念的人談這件事,是講個案比較容易,還是讓他理解數據比較容易?
當然是前者。可以這樣說,對於他人的經歷的理解幾乎是每人都能作到,這或許是生物本能之一。然而對數據的解讀與理解卻是需要後天學習的,沒學過統計學就無法理解薪資平均數並不是指有一半的人有這樣的收入。所以說理解個案比理解數據容易多了,當然也更快。
別讓天性騙了你:透過學習成為有理性的人
常看到的推銷、電視購物、廣告,就很常訴諸這種個案效果,不需要名人,只要找出一兩位個案站出來,說他用了這個產品多久就產生神奇的效果。對產品有疑慮的人一看了成功個案後,很容易就被說服而購買,這也是消費心理學的絕妙手法之一啊。
所以在電視購物、網路看到某個產品多厲害多厲害,要打電話或刷卡之前,請先想想:這效果是個案還是大部分人都會有用呢?千萬別因個案就以為自己也適用。也請記得廠商肯定有高人指點,知道透過成功個案會比較讓人接受,因此你可千萬別上當啊。
另如果是要筆戰,身為理性的一方,就該瞭解到要說服大眾光端出數據肯定是不夠的,得要雙管齊下、理性與感性同時並進才能獲得最佳效果。
心理學有非常多的例子來說明人有太多不理性的決策模式,之後有機會再一一跟大家介紹。那既然人生來就有不理性的決策,那是不是就沒救了呢?對心理學家而言,辭典裡是沒有「沒救了」這三個字的。固然天性影響行為甚大,但後天學習才是決定人最終將會是什麼姿態的關鍵。
天性的影響正說明我們必須對科學素養的培養非常在意又認真,因為唯有透過後天學習來增強理性的部份,才能夠盡量做出相對合理的決策,才有資格自稱為理性的人。
研究出處
Freymuth, A. K., & Ronan, G. F. (2004). Modeling patient decision-making: the role of base-rate and anecdotal information. Journal of Clinical Psychology in Medical Settings, 11(3), 211-216.
我很認同醫師所舉的「魚油,對心肌梗塞的幫助」。
ReplyDelete的確,我們要有一種科學的精神去持平地看待臨床結果。
而臨床結果,也要用一種很科學的態度去接受。
例如,在大規模的臨床試驗中即使只有一個個案失敗,我們也應推翻這是成功的治療方式。
這樣,才會體現科學方式、科學精神!