在進(jìn)行樣本量計(jì)算的時(shí)候很多人都有一個(gè)誤區(qū),以為可以直接拿公式往里套就行。然而事實(shí)是,樣本量的計(jì)算需要有相當(dāng)?shù)慕y(tǒng)計(jì)學(xué)及臨床流行病學(xué)的基礎(chǔ)知識進(jìn)行前期的鋪墊,并且要考慮到眾多的現(xiàn)實(shí)影響因素,簡單來說就是先得出一個(gè)理論值,再根據(jù)實(shí)際情況確定zui終納入研究的樣本量。
影響樣本量估算的因素
1
*類錯誤 (阿爾法)
一般而言 取 0.05, 的取值越小,其所需的樣本量就越大; 的取值存在單雙側(cè)之分,進(jìn)行單側(cè)檢驗(yàn)時(shí)較雙側(cè)檢驗(yàn)的樣本量較少。
一般而言 取雙側(cè)檢驗(yàn)。 選擇單側(cè)還是雙側(cè)檢驗(yàn), 需遵循下列原則:
● 如果目的在于推斷兩組的總體參數(shù) (率、 均數(shù)) 是否存在差別, 實(shí)驗(yàn)組既可能高于對照組, 也可能低于對照組, 那么就用雙側(cè)檢驗(yàn);
● 如果從專業(yè)知識得知確切證據(jù), 試驗(yàn)組不會低于或不會高于對照組, 就應(yīng)該用單側(cè)檢驗(yàn)。
2
第二類錯誤 或者是檢驗(yàn)效能(1- )
其中 越小,檢驗(yàn)效能(1- )越大,那么所需的樣本量就越大。 取值若無特殊說明一般為 0.1 或 0.2,且一般要求檢驗(yàn)效能(1- )在 0.80 以上, 一般取單側(cè)。
3
容許誤差
而其中的容許誤差 是指研究者要求或者客觀存在的樣本統(tǒng)計(jì)量與總體參數(shù)間或樣本統(tǒng)計(jì)量直接的差值。 值越小,其中該研究所需的樣本量越大。
4
總體標(biāo)準(zhǔn)差
其中 反映了數(shù)據(jù)的變異程度,其值越大,所需的樣本量越大。
5
單雙側(cè)檢驗(yàn)與設(shè)計(jì)類型,
設(shè)計(jì)類型不同,所需樣本量不同;一般而言,在其他條件相同時(shí),單雙側(cè)檢驗(yàn)所需的樣本量不同,雙側(cè)檢驗(yàn)所需的樣本量要大于單側(cè)檢驗(yàn)。
平行隨機(jī)對照臨床研究公式解析
2015 年 7 月份筆者收到了某醫(yī)科大學(xué)附屬*醫(yī)院流行病學(xué)與循證醫(yī)學(xué)教研室的研三的學(xué)生發(fā)的一個(gè)某版本教材的一個(gè)截圖,她和其教研室的大部分教授認(rèn)為某個(gè)公式是錯誤的,筆者經(jīng)過考證和查閱相關(guān)資料,并請教了統(tǒng)計(jì)學(xué)專業(yè)的教師,zui后認(rèn)為該教材里面的公式展現(xiàn)方式確實(shí)存在問題,但這個(gè)公式本身沒有錯誤。
圖 1 具有爭議的一個(gè)公式
筆者紅圈(上圖,同圖 1)里面的 0.5 實(shí)際是表示 為雙側(cè)檢驗(yàn),細(xì)心的讀者可能會把這個(gè)教材里面的值代入進(jìn)行驗(yàn)算,發(fā)現(xiàn) n 這個(gè)值也不對,因?yàn)楫?dāng)兩個(gè)率 P1 和 P2 都較小的時(shí)候,arcsin P1 和 arcsin P2 是采取弧度值來進(jìn)行計(jì)算的。
這個(gè)時(shí)候需要將這個(gè)公式的分母部分乘以 /180,即分母部分變?yōu)?2x[( /180)x(arcsin P1-arcsin P2)]2,此時(shí)的分子部分因?yàn)槲覀円呀?jīng)知道 取雙側(cè)檢驗(yàn),所以為了避免產(chǎn)生歧義我們直接用 替代 /2,原公式的分子部分變?yōu)?(Z +Z )2,而其中 sin-1 = arcsin,此時(shí)圖 1 這個(gè)公式將變成如圖 2 所示的公式 2,按照公式 2 去計(jì)算,才能得出這本教材中的這個(gè)值(有爭議的樣本量估算公式見圖 1)。
圖 2 修正后的一個(gè)公式
以上,是漫漫科研路中涉及的問題之一。
關(guān)注本網(wǎng)官方微信 隨時(shí)閱讀專業(yè)資訊