今さら聞けない医学統計の基本

医学統計の基本シリーズ第2回:
統計解析結果を正しく解釈する
解説3:臨床的に意義のある「有意差」かどうかを確認しよう

P値は、グループ間に統計的な有意差があるかどうかを示してくれるけど、臨床効果の程度の差を示すものではないから、処置によって期待される効果とは反対の方向に有意差がみられることも想定できるよね。
ということは、P値と一緒に結果の数値を確認する必要があるということ。

Alt tag

加えて、P値で「有意差あり」と判定されても、それが「臨床的に意義のある差」かどうかは判断できない。そこで「群間差の信頼区間」を用いて、仮説検定の結果から出た有意差が臨床的に意味のある差かどうかを判定する必要が出てくるんだ。

Alt tag

統計学的な有意差があって、母集団で真の差があったとしても、臨床的には意味のない差だった・・・なんてことも場合もあるのよ。

Alt tag
Alt tag

真の差があるのに、臨床的には意味がない・・・そんな状況あるんですか??

例を出して考えてみましょうか。

Alt tag

【例】

高血圧患者1,000例を対象としたランダム化比較試験で、降圧薬Aがプラセボと比較して収縮期血圧を有意(P<0.05)に低下させることが示された。

Alt tag

プラセボと比較した降圧薬Aの投与前後の差の大きさは3mmHgで,その95%信頼区間は1~6mmHgであった。
このことから、「降圧薬Aによる投与前後のデータと矛盾しない治療効果の大きさの範囲は,1~6mmHgである」と解釈できる。

つまり、「降圧薬Aの効果は,大きくても6mmHgで、場合によっては1mmHgしか血圧を下げないかもしれない」ということになる。
結果を見ると、降圧薬Aを投与しても収縮期血圧は高いままである。

Alt tag

図 統計的有意差と臨床的に意味のある差
(出典:浅井隆:いまさら誰にも聞けない医学統計の基礎のキソ 第3巻,127ページ,アトムス,2010(一部改変))

Alt tag

確かに、これでは統計学的に「有意差あり」でも、「臨床的に意義のある差」とはいえないですね。どうしてこのようなことが起きるのでしょうか?

例えば症例数が非常に多い場合、臨床的に意義のある差はないにもかかわらず、仮説検定で「有意差あり」と判定されやすくなります。

Alt tag
Alt tag

症例数は、多ければ多いほど良いというわけではない、ということですね。

ただ、逆に対象者が少なすぎると、本当は差があるのに仮説検定で「有意差なし」となってしまうことがあるからね。
研究内容に応じて、適切な症例数を設定することが重要なんだ。

Alt tag

症例数が十分であれば、「有意差なし」の信頼性は変化します。
次はその点を整理してみましょう。

Alt tag