跳到主要內容

[EBM] 當統計不顯著時,我該計算研究的檢力嗎?Misleading post-hoc power

看文獻、做研究時,碰上不顯著,總想起統計老師的話「不顯著代表不能拒絕虛無假說,不代表兩者相同」。我們又學過,發現兩者差異的能力稱為檢定力 (Power),那是不是計算資料的 Power,如果這「發現差異的能力」大於80%,卻仍然有不顯著的結果,就代表這兩組資料真的很相近呢

以前是那麼相信的,但越算越覺得奇怪

直到自己多算了幾次,發現 Power 其實和 P-value 是非常掛鉤的。Power 與 P-value 都是受到樣本數、標準差、平均差的影響。當兩組的平均差很近、P-value >0.05時,表示兩組資料的分佈重疊部分很高,用這樣的結果來計算 Power ,當然會獲得一個很低的 Power。

(進一步澄清,這個實驗做完才計算的 Power 稱為 Post-hoc power,是今天要討論的主題。而我們在計算需收樣的樣本數時的 ,則直接稱為 Power,是很重要且有需有的步驟。)


Post-hoc power 其實受到 P-value 的影響

我開始看更多文章,發現原來 Post-hoc power的計算,就受到了P-value的影響(畢竟他們都是用同樣的樣本數、標準差、平均差來做計算),當 P-value >0.5,我們計算 Post-hoc power 希望達到 0.8 時,其實要 P-value 小於0.0065才能達到,這可不是自相矛盾嗎!


那我們不計算 Post-hoc power,還可以怎麼做呢?

第一個,我們可以計算 Partially post-hoc power,這是這篇文章提出來的方法。當然這名字很奇怪,怎麼會有個 partially post-hoc 的東西呢?他提到的是,我們用來計算 Power 的平均差,應該要用 Minimal clinically important difference (MCID, 最小臨床有意義差距) 來代替,這樣可以脫離與P-value的掛勾。解釋時就會從「我們有 post-hoc power % 的信心,去發現這兩組有達到顯著差異」,變成「我們有  post-hoc power % 的信心,去發現這兩組有達到 MCID 的顯著差異」。

第二個,我們可以看結果的信賴區間 (Confidence interval) 搭配「有意義的最小差距」(MCID)。以身高來說,有意義的 MCID 當作是 5公分。這時如果想知道兩班的身高差距,我們得到身高差距的95%信賴區間是 [-2cm, 3cm],那我們可以判斷有包含到 0,所以這是個不顯著的結果,且信賴區間的範圍沒有包含到 +5cm , -5cm,表示就算有差距也到有意義的程度。而如果我們得到的是 [-10cm, 20cm],那不只是不顯著,還表示差距從矮十公分,到多二十公分都有可能,這時我們就不太敢說兩組沒有差距了。

第三個,我們可以用貝氏定理 (Bayesian model),這在臨床研究上較少見,判讀起來大家也較不熟悉。統計分成兩種大類,第一類是傳統的統計,也就是看分佈來計算可能性,我們平常用的 t-test、ANOVA 等都是屬於這一類。第二類是貝氏定理,會先主觀地給出一個可能的機率、數值 (prior),然後在我們收案後,去計算可能的機率變成多少。這是相對於傳統統計的一大類別,個人瞭解也不夠深入,有興趣的再請自行 Google 吧~

三種替代方案,使用哪個方法好呢?

依據找到的方法學論文,Partially post-hoc power他認為仍然是基於Post-hoc power的計算,所以還是會受到收到的資料影響;Confidence interval 搭配 MCID 則很好判讀、很通用,是個好選項;Bayesian model 應該是最好表達實際狀況的方法,但是多數人不熟悉。

這樣看來,最實用的就會是Confidence interval的判讀了。而這其實也 2022 年 09 月 Cochrane GRADE guideline 最新提出,對不準確  (imprecision) 的判讀方法相吻合,在這個項目,GRADE不看 p value,而是看 95% 信賴區間是否包含到MCID的上下限來做判斷,有興趣可以看這個新發表的影片



留言

熱門文章

<第一階段醫師國考>準備方法分享1: 科目特性分析

記得剛開始要準備一階時的徬徨,回想起之前曾寫過一篇國考心得,就來整理成網誌版分享囉!我是2017年暑假的考生,以下會用四個方向來分享: 科目特性分析 :講述依照特性來對應讀書方法、各科分析、資源介紹,幫助讀書計畫的擬定 個人準備過程 :個人的目標、讀書方法 可用資源、其他建議 整體分析:依照科目特性排定讀書法 科目可以區分成:理解/背誦,臨床/基礎。相應的就會有不同的讀法。 理解性強、進臨床很實用的 科目:生理/免疫/生統與流病 讀書方法:懂了後不易忘, 學期間 / 前期的首要目標 背誦性高 科目:寄生蟲/微生物/藥理 讀書方法: 衝刺前期優先整理表格 ,減少緊張感,考期近了再複習 理解兼背誦、不實用... 科目:生化 讀書方法:你自己決定... 另外,如果有影片可看 → 花時間,但不用動大腦整理 科目:解剖/病理、補習班影片等 讀書方法: 填滿時間空擋 ,精神差時好用 各科分析 大體解剖+組織+神解 → 全部靠趙俊彥吧 趙俊彥 優點:很強的統整&簡化能力,可以幫助把解剖&神解學好,神人啊 缺點: 神解教的雖好,但內容太多/考題太少,很趕的話可以跳過6-9集 使用方法 可以先看趙俊彥考古題,看這部分的重點在哪,五年一單位的原則要把握 (見可用資源) 個人一開始會畫畫,發現很花時間後,改成把影片截圖,用電腦在旁邊做筆記,速度更快 所需時間:雖然可加速播放 (個人用1.6x-2.2x),不過加上筆記,還是1小時影片花1小時 12集內容分析 骨肌:1-5集,獨立區域,可在任何時間念 神解:6-9集,考得不多,但講得很好,看個人興趣 內分泌、心血管、呼吸:10-12集,可以搭配模組使用 缺少:消化、泌尿、生殖、胚胎、小腿肌肉 → 看舊版 ,可以搭配模組使用 生理:很重要,務必讀熟 分析: 理解性的很難忘,未來臨床也很重要 使用書本:BRS,講得很好,推薦在讀各模組時就先使用,有老師沒講的也可以念 藥理:重要,但真的難背,靠長期不斷背誦 or 考前短期衝刺 xD 分析 現在很難背,投資報酬率不高,至少讀完的內容是自主神經 以後到各科重複用就會背起來 →  不管國考的話,重點是知道機轉&副作用 使用書本 /...

<系統性回顧工作坊>課後收穫1: 診斷、預後、傷害型研究用PICO搜尋嗎

Prof. Edwin Chan 是 Director of Cochrane Singapore,算是亞洲地區 EBM 與 Systematic review 的大師,本身有很豐富的學術經驗。很榮幸也很幸運的,花蓮慈濟醫院在 2018年12月5日,請他來為我們舉辦一日工作坊。看到這樣大師級的人物,即使搭夜車,也從嘉義大林趕回到花蓮上課了(路途遙遠啊!)接下來的幾篇,將舉這次印象深刻的幾個重點來跟大家分享囉。 PICO萬能? 每次提到EBM,大家最常反射想到的就是”PICO”,是我們常用來搜尋文獻的好工具, 但PICO真的萬能嗎? 在面對不同類型研究時,其實應該要使用不同的搜尋策略: Therapeutic: PICO Diagnostic: PIGO Harmfulness: PEO Prognostic: PO Therapeutic study 用 PICO 常聽到的PICO,其實是為了治療型的研究設計的 ,包含有特定的族群 (P)、介入的措施 (I)、比較的措施 (C)、想看的結果 (O)。 先來細看下PICO的內容吧,以這個題目示範:咖啡因可以增加早上想睡的人反應時間嗎? Population: 要針對哪些研究族群來搜尋,在此就是Adults with daytime drowsiness Intervention: 給予什麼介入措施,在此就是Caffeine Comparison: 跟什麼做比較;我們使用 Placebo / Decaffeinate 要注意的,不管在什麼題目都 不應該只擺上「無介入」,而是應該使用安慰劑或是其他療法 所以不應該用「沒喝咖啡」,而是應該跟「喝安慰劑」,也就是去咖啡因的飲料來做比較。不然 或許是喝東西的動作,或是對於咖啡的預期效應而讓我們清醒 。 Outcome: 想要比較什麼結果,在此就是Reaction time 這樣的搜尋,就能找到非常精確的結果。 (搜尋方法如:MeSH、Title search、Filter等,請看下篇文章: <系統性回顧工作坊>課後收穫2:搜尋結果很少,就等於搜尋方式很好嗎 ) Diagnostic study 用 PIGO 針對診斷型的問題,我們最後的目標是想知道...