11/02/2014

對於用台灣健保資料庫發表「A may be associated with the risk of Z」論文的看法

對於用台灣健保資料庫發表
A may be associated with the risk of Z」論文的看法


蘇冠賓


這類的研究不能支持因果關係

以「藥物A may be associated with the risk of Z病」為例,健保資料庫都是觀察性的資料,資料形成的過程完全不考慮變因的控制(這不是統計可以完全控制校正的)。

例一:藥物A用在B病,B病又有C飲食、D生活形態、E共病,我們就分不出是A藥、B、C、D、或E和Z有直接的關係(並不是A藥容易導致Z病);

例二:吃藥物A的人可能F倍於常人去看醫生、G倍於常人被檢查出Z病,這時吃藥物A反而變成提高(早)診治Z病的有利因素(用A藥更容易讓病人的Z病被發現,而非導致Z病);

例三:醫師都知道藥物B容易誘發Z病,所以遇到Z病的高風險族群就開比較安全的藥物A,健保資料庫發表的結果可能就變成藥物A(而非藥物B)容易導致Z病(相反)。

健保資料庫發表的論文,很容易都可以找到更多類似的 confounding factors。我自己也發表資料庫研究,也會都提醒讀者,不要用因果關係來解讀。

這類論文為了吸引讀者注意,有時在標題或結論上言過其詞

其實期刊的目的都是要增加讀者數量,標題的目的之一也是希望吸引讀者注意,但超然客觀的讀者會保有批評性。站在主編的立場,如果作者沒有膽量多做一些詮釋,文章沒有爆點,也就較引發不了讀者的興趣,「吸引力」在科學性期刊的標準雖然較嚴謹,但仍是通則。即使是Nature或Science,當他們發表關於 "genetic discovery," "emapathy," "decision making," "novel target for…" 的文章,保守的研究者都會認為言過其詞,但方法健全又在合理範圍內有說服力的話,仍是可以被多數樂觀的專家接受的(大家都知道不是真的如此,但都認為有可能如此…)。所以,看週刊要懷疑,看科學期刊更要理性批判。

有人擔憂這種論文會讓媒體刻意誤導,造成民眾用藥的恐慌,因此排斥貶低此類論文。其實,科學的精神之一,就是對同一個結果(現象),包容所有可能的合理的解釋。但發表的技巧,會把合理的解釋包裝的有可看性(有時需勇於挑戰尺度,並客觀帶過其他甚至相反的解釋)。在產業界、現實生活、乃至於媒體報導,這個標準都會隨著專業領域、個人偏好、和特定的目被調整。現實是,這個尺度永遠是相對的。每個人都有自已的尺度:我們有「科學」的尺度,就不得不接受其他人用「媒體」的尺度。不管你寫(說)的多客觀,媒體仍然有辦法剪接出他想要的方向(無奈…)。我想,病人的擔憂,就留著讓照護他們身心健康的好醫師去安定了。

資訊充斥,實証正正反反是常態,保有對現象的好奇和存疑,才能包容「爭議性」、挑戰「必然性」。能夠對於同一個研究結果有正反兩面的批判,基本上應該是可喜的。

對於研究者有勇氣發表爭議性的結果,我個人是很佩服(雖不一定認同其結果)。學術研究和發表論文是非常艱難的,台灣仍有醫師在這塊辛苦的園地耕耘,讓台灣學術在國際學術領域中站得住,也是值得一些掌聲。然而,發表台灣健保資料庫的研究團隊若能繼續利用細胞或動物模型的基礎研究去探索機轉、並在前瞻性研究中去証實他們報告的現象,當然就比「為發表而發表」更加令人敬仰了。

(註) 在寫本文的一週內,台灣在PubMed發表共十篇健保資料庫論文。
1.        Shen TC, Lin CL, Chen CH, Tu CY, Hsia TC, Shih CM, Hsu WH, Sung FC. Increased Risk of Chronic Obstructive Pulmonary Disease in Patients with Rheumatoid Arthritis: A Population-based Cohort Study. QJM. 2014 Feb 3.
2.        Lee YW, Chen TL, Shih YR, Tsai CL, Chang CC, Liang HH, Tseng SH, Chien SC, Wang CC. Adjunctive traditional Chinese medicine therapy improves survival in patients with advanced breast cancer: A population-based study. Cancer. 2014 Feb 3.
3.        Chan TF, Wu CH, Lin CL, Yang CY. Statin use and the risk of breast cancer: a population-based case-control study. Expert Opin Drug Saf. 2014 Feb 3.
4.        Huang CC, Chung CM, Leu HB, Lin LY, Chiu CC, Hsu CY, Chiang CH, Huang PH, Chen TJ, Lin SJ, Chen JW, Chan WL. Diabetes mellitus and the risk of Alzheimer's disease: a nationwide population-based study. PLoS One. 2014 Jan 29;9(1):e87095.
5.        Wang HK, Tsai KJ, Huang CY, Wang LC, Lu K, Chen HJ, Lin CW, Lee YJ, Fang PH, Chang LC, Li YC. Newly Diagnosed Dementia and Increased Risk of Hemorrhagic Stroke: A Nationwide Population-based Study. Curr Alzheimer Res. 2014 Jan 31.
6.        Wu PY, Lin CL, Sung FC, Chou TC, Lee YT. Increased risk of cardiovascular events in patients with herpes zoster: A population-based study. J Med Virol. 2014 Jan 30.
7.        Chung WS, Lin CL, Chang SN, Lu CC, Kao CH. Systemic Lupus Erythematosus Increases the Risks of Deep Vein Thrombosis and Pulmonary Embolism: A Nationwide Cohort Study. J Thromb Haemost. 2014 Jan 29.
8.        Chang CY, Yeh GC, Lin SY, Tseng IJ, Tsai CH, Lee YW. Trends in the epidemiology, diagnosed age and mortality rate of haemophiliacs in Taiwan: a population-based study, 1997-2009. Haemophilia. 2014 Jan 29.
9.        Chen TH, Hsiao HP, Chiu YW, Shih NH, Chuang HY, Huang CT. Maternal diabetes or hypertension and lifestyle factors may be associated with metabolic syndrome: A population-based study in Taiwan. Kaohsiung J Med Sci. 2014 Feb;30(2):86-93.
10.      Su VY, Chen TJ, Yeh CM, Chou KT, Hung MH, Chu SY, Su KC, Chang YS, Lin YH, Liu CJ. Atopic dermatitis and risk of ischemic stroke: A nationwide population-based study. Ann Med. Epub 2014 Jan 27.


2 comments:

  1. 雖然健保資料庫是一個龐大的資源寶庫,但是我覺得在台灣的升等評比制度(impact factor掛帥)之下,它已經變成許多人升等教職的捷徑,不需要花費一兩年收個案分析可能得不到的結果,只要拼命跑dry lab data, 有顯著差異就可以發表到SCI paper.彷彿台灣開蛋塔店一般,看到有利可圖便大家一窩蜂投入,人人都可發SCI paper,這是我看到的趨勢...

    ReplyDelete
  2. Fisher投資踩坑筆記 · ·
    #倖存者偏差 在投資資訊的應用
    對總經趨勢有興趣的主動投資新手一定要閱讀這篇,可以保命。
    倖存者偏差(survivorship bias),是一種邏輯謬誤。只關注"倖存"的資訊,忽略那些沒有倖存的(可能因為無法觀察到),從而得到錯誤的認識。
    倖存者偏差最有名的案例是二次世界大戰期間,美國統計學家沃德教授(Abraham Wald)被授命研究《如何降低飛機被擊中的機率》的命題。
    沃德教授研究發現:飛回來的飛機中機翼的彈孔最多,飛行員座艙和機尾則最少。
    依照當時的航空技術,機器的裝甲為避免過重只能局部強化,軍方指揮官認為既然機翼最容易中彈,當然應該加強機翼的防護,而沃德教授則建議應該增加飛行員座艙和機尾的防護。
    沃德教授認為指揮官的判斷就是犯了「倖存者偏差」這個邏輯歸因的錯誤。
    從統計觀點來看,被多次擊中機翼的轟炸機,依然能夠安全返航,而在飛行員座艙和機尾的位置彈孔最少。那並非真的不會中彈,而是一旦中彈,根本就回不來了。
    後來事實證明教授的建議是正確的,聯軍轟炸機被擊落的比例顯著降低。
    (以上資訊來自維基百科)
    --------------------我是分隔線----------------------
    在許多總經數據研究中, 很多報告曾舉出例子經濟衰退前都必然有某些事件, 概率為100%。
    很多人對此類回測奉為聖經, 但對於此類數據, 建議最好自己回測過一遍, 並且拉長時間範圍。
    很多時候, 真正重要的資訊是那些沒被表現出來的數據, 有如那些沒有飛回來的飛機。
    最近的就是殖利率倒掛, 自1970年以來, 7次衰退前, 都有殖利率倒掛此一現象的出現。
    於是人們便認為殖利率倒掛就預告經濟即將衰退。
    也有媒體宣稱: 殖利率倒掛收斂時就是景氣衰退發生時。
    但媒體通常不會告訴您,
    經濟衰退前都有殖利率倒掛此一現象, 100%。
    但殖利率倒掛一共發生過11次, 預言了其中的7次衰退。
    殖利率倒掛與經濟衰退並非出現一次倒掛就衰退一次。
    所以也就沒有"殖利率倒掛收斂時就是景氣衰退發生時"這種事。
    殖利率倒掛其實是表示經濟過熱, 未來看淡, 然而還有多少好日子, 沒人知道。
    在高通膨時期經常出現,預告準度低, 低通膨時期出現次數較少,預告準度高。
    我曾經跟一朋友爭論, 主動投資究竟是要自己做研究?還是只看別人的研究就可以?我也看別人的研究, 但我有興趣的資訊會去複驗, 真相往往就能水落石出,
    通常跟原先的認知有落差。
    --------------------我是分隔線----------------------
    以前我曾在一個強大的國度工作生活多年,最大收穫就是從某個神奇的團體學到一件事: 如果要操縱一個人的行為, 只需要操縱其資訊即可。
    試想: 如果要一個人自己從一個房間跑出去? 是不是只需要他相信發生了火災?
    操縱一個人只需要封閉其多元資訊管道, 並千口一詞, 自然能讓他相信一切謊言。
    在前東家上班時, 上司喜歡看數據漂亮的報告, 他也從不去第一線, 只看報告,然而真實情況遠遠並非如此。
    於是上司會不斷地退回報告, 我在絞盡腦汁, 3天不睡覺後, 想出一個方法, 只要調整資料呈現角度與標準, 就能夠把不漂亮的數據變得漂亮, 而且沒有說謊, 只是看待數據的角度不一樣而已。
    例如某產品一年內的良率在90%~50%波動, 我可以選取其中數據最漂亮的一週呈現, 那週數據良率為90%, 然後把時間以最小字標註在右下角。
    要不就是呈現A產品(自家生產)跟B產品(別家生產)的一年內良率平均都是90%, 但是卻是維修後良率, 而業界通行標準是"維修前良率", 俗稱"直通率"。
    我沒有數據造假, 我只是沒展現真正有鑑別度的資訊, 而且也標示出來了,你沒看出問題, 那是看報告的人的能力不足。
    後來我更看出一個問題, 上司從頭到尾都沒有下令讓我數據造假, 他只是不斷退回報告, 操弄數據的人是我, 但是他的用意就是讓我繳出一份他滿意的報告,他好去跟上面交差。不操弄數據根本做不到, 他心知肚明。於是這個鍋, 得我來背。
    投資領域各樣資訊很多都有類似問題, 回測時間太短, 沒有用通用標準等等....
    新手很容易被這類似是而非的資訊誤導, 進而做出錯誤決策。
    電腦科學中有句話叫 :『Garbage in, garbage out』說明了如果將錯誤的、無意義的資料輸入系統,系統自然也一定會輸出錯誤、無意義的結果。
    做主動投資, 資訊鑑別能力非常重要, 公司高層在法說會上的說法也未必全是事實。
    建議主動投資者多關注各種認知謬誤,提升決策品質。
    不要相信各種未驗證過的單一資訊, 即使是專家, 大師提供的資訊。
    兼聽則明, 偏信則暗。相信方法, 不要相信所謂專家或網紅,至少需要複驗。
    #垃圾進垃圾出
    #資訊操弄
    #投資判斷

    ReplyDelete