今さら聞けない医学統計の基本

医学統計の基本シリーズ第2回:
統計解析結果を正しく解釈する
解説4:「有意差なし」を適切に解釈する方法

三宅先生が言われたように、「有意差なし」という結果になった場合、本当に両グループ間で差がないのか、単純に対象者数が足りなくて差が出なかっただけなのかは分からないよね。
では、対象者数が十分だと分かっている上で、「有意差なし」という結果になったら・・・どう捉えることできるかな?

Alt tag
Alt tag

「本当に両グループ間で差がない」といえる・・・ということですか??

そこまでは言えないんだけどね。
「100%差がない」とは断定できないけど、「本当に差がない」可能性が高まった、と捉えることができるわね。

Alt tag
Alt tag

図 統計的「有意差なし」の適切な解釈

Alt tag

対象者数が十分かどうかを判断するには、どうすれば良いですか?

研究に必要十分な症例数を決定するひとつの方法として、「サンプルサイズ推定」があります。
論文中に「サンプルサイズ推定により必要十分な症例数を決めた」という記述とその条件の記載があれば、有意差を検出するのに十分な症例数であると判断しても良いんじゃないかな。

Alt tag

逆に考えると、症例数が十分であれば「本当に差がないために有意差が認められない」可能性も高くなるということだね。

Alt tag

さらに、その信頼性の程度を数値で示すのが「検出力(power)」。
検出力が0.8だとしたら、グループ間に本当に差があったとして、仮説検定で80%の確率で「有意差あり」と判定できる症例数が設定されていることになるね。

Alt tag
Alt tag

それはつまり、本当は差があるのに「有意差なし」と誤判定してしまう確率が20%あるということですか?

言い換えればそういうこと。
論文によっては検出力という言葉や数値が出てこない場合もあって、その場合は「αエラー(alpha error)」や「βエラー(beta error)」というものが示されているよ。

Alt tag
αエラー

「差がない」のに、仮説検定で「有意差あり」と誤った判断をすること。
「第1種の過誤(typeⅠerror)」とも呼ばれる。

「P<0.05を有意差ありと考えた」、「有意水準は0.05を使用した」、「α=0.05とした」は、いずれも「差がないのに有意差ありと誤った判定が出る確率が5%未満ということを示している。

βエラー

「差がある」のに、仮説検定で「有意差なし」と誤った判定をすること。
第2種の過誤(type Ⅱ error)」とも呼ばれる。

検出力とβは 【検出力=1-β】の関係がある。
検出力が0.8(またはβ=0.2)であれば、本当は差があるのに「有意差なし」と見逃す確率が20%に抑えられるということを示している。

(出典:浅井隆:いまさら誰にも聞けない医学統計の基礎のキソ 第3巻,143-145ページ,アトムス,2010(引用))

一般的に、仮説検定のP値の有意水準として0.05が選ばれるのと同様に、検出力は0.8~0.9(つまりβは0.1~0.2)の値が選ばれるのが慣例といえるね。

Alt tag
Alt tag

ん?ということは、αエラーの確率は5%未満なのに対し、βエラーの確率は10~20%未満ということですか??

そう、大切なことに気付いたね、若林君。

本当は差があるのに有意差なしと判定してしまう確率は、差がないのに有意差ありと判定する確率よりも高いということだね。

Alt tag
Alt tag

図 αエラーとβエラー

つまり、仮説検定で「有意差なし」と判定されても、その結果をあまり信じない方が良い、ということがわかったかな??

Alt tag
Alt tag

ハイ!ありがとうございました!
先生方のおかげでP値の意味や「有意差なし」を「同等」と解釈してはいけない理由がよくわかりました!!

では、ここで今日のまとめです。

Alt tag

第2回 「統計解析結果を正しく解釈する」 まとめ

イントロダクション
「統計的に差がないこと」は、必ずしも「同等であること」を意味しない統計解析結果を正しく解釈するには「P値と有意水準」の適切な理解が必要

  1. P値と有意水準
    P値:データと帰無仮説の矛盾の程度を測る指標
    有意水準:帰無仮説を否定するかどうかを判定するための基準(一般に0.05(5%))
    P<0.05:有意差有り
    P≧0.05:有意差なし
    帰無仮説は、間違っていることは証明できても、正しいことはデータからは証明できない
  2. 臨床的に意義のある「有意差」かどうかを確認しよう

    P値は「統計的な有意差」は評価できるが、「臨床的な効果の差」は評価できない「統計学的に有意差あり」でも、「臨床的に意義のある差」とは言えないことがある

    例)大規模集団においては、「臨床的に意義のある差」が小さくても統計学的に有意差ありとなることがある

  3. 「有意差なし」を適切に解釈する方法

    研究を始める前に必要なサンプルサイズ(症例数)を推定しておく
    サンプルサイズの推定にはα(一般に0.05)、β(一般に0.2)、期待したい群間差を使用する。
    適切なサンプルサイズで実施された質の高い研究で有意差なしが得られた場合は、「本当に差がないために有意差が認められない」可能性が高いと解釈

参考資料

1)   浅井隆:いまさら誰にも聞けない医学統計の基礎のキソ第1巻、 第3巻,アトムス,2010