跳到主要內容

[EBM] 當統計不顯著時,我該計算研究的檢力嗎?Misleading post-hoc power

看文獻、做研究時,碰上不顯著,總想起統計老師的話「不顯著代表不能拒絕虛無假說,不代表兩者相同」。我們又學過,發現兩者差異的能力稱為檢定力 (Power),那是不是計算資料的 Power,如果這「發現差異的能力」大於80%,卻仍然有不顯著的結果,就代表這兩組資料真的很相近呢

以前是那麼相信的,但越算越覺得奇怪

直到自己多算了幾次,發現 Power 其實和 P-value 是非常掛鉤的。Power 與 P-value 都是受到樣本數、標準差、平均差的影響。當兩組的平均差很近、P-value >0.05時,表示兩組資料的分佈重疊部分很高,用這樣的結果來計算 Power ,當然會獲得一個很低的 Power。

(進一步澄清,這個實驗做完才計算的 Power 稱為 Post-hoc power,是今天要討論的主題。而我們在計算需收樣的樣本數時的 ,則直接稱為 Power,是很重要且有需有的步驟。)


Post-hoc power 其實受到 P-value 的影響

我開始看更多文章,發現原來 Post-hoc power的計算,就受到了P-value的影響(畢竟他們都是用同樣的樣本數、標準差、平均差來做計算),當 P-value >0.5,我們計算 Post-hoc power 希望達到 0.8 時,其實要 P-value 小於0.0065才能達到,這可不是自相矛盾嗎!


那我們不計算 Post-hoc power,還可以怎麼做呢?

第一個,我們可以計算 Partially post-hoc power,這是這篇文章提出來的方法。當然這名字很奇怪,怎麼會有個 partially post-hoc 的東西呢?他提到的是,我們用來計算 Power 的平均差,應該要用 Minimal clinically important difference (MCID, 最小臨床有意義差距) 來代替,這樣可以脫離與P-value的掛勾。解釋時就會從「我們有 post-hoc power % 的信心,去發現這兩組有達到顯著差異」,變成「我們有  post-hoc power % 的信心,去發現這兩組有達到 MCID 的顯著差異」。

第二個,我們可以看結果的信賴區間 (Confidence interval) 搭配「有意義的最小差距」(MCID)。以身高來說,有意義的 MCID 當作是 5公分。這時如果想知道兩班的身高差距,我們得到身高差距的95%信賴區間是 [-2cm, 3cm],那我們可以判斷有包含到 0,所以這是個不顯著的結果,且信賴區間的範圍沒有包含到 +5cm , -5cm,表示就算有差距也到有意義的程度。而如果我們得到的是 [-10cm, 20cm],那不只是不顯著,還表示差距從矮十公分,到多二十公分都有可能,這時我們就不太敢說兩組沒有差距了。

第三個,我們可以用貝氏定理 (Bayesian model),這在臨床研究上較少見,判讀起來大家也較不熟悉。統計分成兩種大類,第一類是傳統的統計,也就是看分佈來計算可能性,我們平常用的 t-test、ANOVA 等都是屬於這一類。第二類是貝氏定理,會先主觀地給出一個可能的機率、數值 (prior),然後在我們收案後,去計算可能的機率變成多少。這是相對於傳統統計的一大類別,個人瞭解也不夠深入,有興趣的再請自行 Google 吧~

三種替代方案,使用哪個方法好呢?

依據找到的方法學論文,Partially post-hoc power他認為仍然是基於Post-hoc power的計算,所以還是會受到收到的資料影響;Confidence interval 搭配 MCID 則很好判讀、很通用,是個好選項;Bayesian model 應該是最好表達實際狀況的方法,但是多數人不熟悉。

這樣看來,最實用的就會是Confidence interval的判讀了。而這其實也 2022 年 09 月 Cochrane GRADE guideline 最新提出,對不準確  (imprecision) 的判讀方法相吻合,在這個項目,GRADE不看 p value,而是看 95% 信賴區間是否包含到MCID的上下限來做判斷,有興趣可以看這個新發表的影片



留言

熱門文章

[投資理財 2] 唯一目標是避開風險:資產配置

投資理財的目標是用錢滾錢、提早退休嗎?答案是,但也不是。         這一兩年來,看過幾本理財觀念的書,包括智慧型資產配置、投資金律、增長的本質、黑天鵝等等。這些書給我最重要的概念是—— 永遠會有不知名的經濟危機出現, 思考的不該是「發生的機率」,而是「避開的方法」 。 先說說結論,以及我們的因應方法: 投資單一公司可能倒閉,因此我們投資整個國家 投資單一國家可能衰弱,因此我們投資全球股市 投資只有股市可能蕭條,因此我們搭配全球債券 投資股票債券可能同跌,因此我們加上抗通膨、貴金屬 單一公司可能倒閉,因此投資整個國家         常常會聽到別人說要「存零股」,然後會舉出那些存零股後靠著股息可以過好日子的故事,讓人非常嚮往,想像自己買到未來的台積電,然後幾十年不愁吃穿。這是個很美好的故事。         可是現實並不這麼美好。想像一下你剛好買到台積電的機率有多低,如果是一萬分之一好了,那實在很困難。可是為何還是有這樣美好的故事呢?因為想要買單一股票的人絕對超過一萬個,因此會有好一群人真的靠著買單一股票存到現在,他們就是存活下來的人,他們可以大聲說話,而那些失敗的卻都噤聲了。這是「存活者偏差」。         買單一公司的上漲可能大,同時也伴隨著下跌甚至崩盤下市的可能,這是不能忽略的,若只想著上漲而不想他消失的可能,那會被矇閉雙眼。 為了避開他可能下市的風險,我們要多買幾家公司,因此我們投資整個國家的市場 。 (關於如何投資整個國家的市場,請搜尋綠角對於ETF的介紹。簡單來說就是透過購買某隻股票,可以幫你買進整個國家的前五十大公司,因此你可以一次擁有整個國家的好公司。) 單一國家可能衰弱,因此投資全球股市         那麼我們投資整個國家了,可是如前面所述,單一國家可能會衰弱,當把命運都跟這個國家綁在一起時,是危險的。像很多人只夠買了台股,可是 台股其實佔全球股票市場不到5%的價值,但我們卻把100%都放在上面,這是很脆落的 。(誰知道哪天對面鄰居會不會打過來,台幣崩盤呢?) ...

第一次踏上美國,第一次復健科國際會議 AAP Physiatry '23

今年二月去到美國參加復健科醫師年會 (Association of Academic Physiatrists, AAP) ,這是我第一次參加復健科的國際年會,也是疫情後難得的出國,更是我第一次到美國。整趟12天的旅程,充滿從復健專業到文化衝擊的各種收穫。 雖然已經過了兩個月,但總覺得該寫些什麼來記錄下這段旅程。 那些在國外看到的不同,讓在台灣習以為常的事物,都變得不尋常 ,回到台灣後,都還在心中繚繞。希望能藉這些文字,跟其他住院醫師和更多讀者們分享我的收穫。 先偷渡一張迪士尼的照片,還是要來玩一下啦! AAP Physiatry '23會場 Part I: 活躍的社交氣氛 在美國,好像每個人都可以互相聊上幾句,不管等公車、搭電梯,只要眼神碰上了,就可以自然而然地開始聊天。回想在台灣,這種場合可能會讓人尷尬,生怕講了話會打擾別人。但美國人好像天生很擅長寒暄,總是能自然地與人交流。 這樣社交特質,在年會中更是彰顯無疑。會議中有許多時間是專門用來交流的,包含晚宴、住院醫師派對、導師活動等等。 不需要什麼破冰活動,大家自然而然就能開始認識周圍的人 。 即使不是專門用來交流的時候,以海報發表為例,每天下午五點左右,會場會擺出好幾張點心桌,還有臨時的酒吧區,大家可以自由地拿取食物與各式酒精 (種類超齊全!)。然後,大家就穿梭在海報區,與發表者和與會者聊天。我甚至覺得,其實 海報內容或許不是他們最在意的,而是這過程的交流才是 ! 海報會場有專人現烤棉花糖巧克力餅乾,熱量滿分! 另外,在晚宴時間,一樣是自助餐形式的Buffet,只有幾張座椅,其他則擺放了幾張高桌,方便大家可以走來走去聊天。遇到有興趣的話題就能加入閒聊,不想聊天時,也可以走到表演區。他們竟然請來了樂團與舞者,為大家演唱流行樂。到晚宴快結束,大家還聚在樂團前面跳舞。 看著那些白天講課的資深講師,在音樂中擺動,覺得非常親切和放鬆~好像意外參加了場美國Party的感覺? AAP 晚宴落幕前,大家都來跳舞 在開心聊天後,常常聽到「哇,真是太棒了,我們之後一定再聯絡喔,有什麼機會可以來合作!」 在這過程中,我好像看到,原來那一個個跨醫院的計畫、研究案,就是在這樣的會議中談起來的 ,美國的醫療也在這過程不斷地帶著彼此進步。 參加了這次會議,認識來自美國各醫院的人,好像為未來展開了更多可能性,讓人很期待也很振奮! Par...