今さら聞けない医学統計の基本

医学統計の基本シリーズ第5回:
Kaplan-Meier曲線を理解する
解説4:Kaplan-Meier曲線からわかる試験の問題点

まずは、Kaplan-Meier曲線のひげが引かれている時点に注目してみよう。
例えば、赤枠で囲んだ箇所はどうかな。

Alt tag
Alt tag

図 心不全患者における早期打ち切り例

Alt tag

試験開始からわりと早い時点でひげがついてますね。

そう。赤枠内にある打ち切り例は、長くても1ヵ月程度しかフォローされていないということになる。さらに短い症例では、試験開始時点から数日で打ち切りとなっているね。

Alt tag
Alt tag

試験開始から数日で脱落したということですね!?

それだけじゃない。試験終了の数日前に登録されたのかもしれない。
いずれにしても、登録後すぐに試験を終了しているため、観察期間が短く、得られる情報が少ないということになるね。

Alt tag
Alt tag

信頼性の高くない研究ということでしょうか??

そうだね。一旦まとめてみよう。

Alt tag

Kaplan-Meier曲線で左の方にひげがたくさん立っている

Alt tag
check-solid-orange.svg

試験開始直後、同意撤回などにより脱落した対象者が多い可能性がある
→試験の計画や運営体制が疑問視される

check-solid-orange.svg

試験終了の数日前に登録された対象者が多い可能性がある
→情報量が少ない

Alt tag

あまり品質の良くない臨床研究であると疑われる

例に出したグラフでは、赤枠内の打ち切り例が10例にも満たないため、まあまあの質だといえるね。

Alt tag
Alt tag

臨床試験のデータをみると、ヒゲがないグラフの方が多い気がしますが、どこに注目すればよいでしょうか?

  

black-diamond.svg

ヒゲのないKaplan-Meier曲線

症例数が多い試験では、打ち切りを示す「ヒゲ」を書かない代わりに、症例数の推移を数値で記載します。具体的にグラフをみてみましょうか。
ここでは、1年単位でフォローアップされた症例数が示されています。

Alt tag
Alt tag

図 心血管イベント観察例のフォローアップ状況

たとえば、スタチン群の症例数をみると、試験開始時点は850例だったのが1年時点で701例になっているでしょ。

Alt tag
Alt tag

つまり・・・打ち切り例とイベント発現例の合計が149例ということですか。

その通り。そしてグラフから読み取れる1年時点のイベント回避確率は、両群とも85%程度だね。これらの情報を合わせると、打ち切り症例の大まかな内訳が推測できるんだ。

Alt tag

つまり、スタチン群は701÷850で約82%、プラセボ群は688÷847で約81%の症例が1年時点で残っているということ。
生存確率が約85%であることから、両群の1年以内の打ち切り例は3~4%だろうということですよね、三宅先生。

Alt tag

そうだね。これくらいであれば、それなりの質を保った試験だろう。仮に最初の1年で、850例→300例に減っていたとしたらどう考える?若林君。

Alt tag
Alt tag

半分くらいの症例が試験終了の1年前に集中して登録された、というのはどうでしょうか。つまり、それらの症例は試験終了時点では、観察が1年で終了したため、すべて打ち切りとなった。

そうだね。そう考えるのが適切だろう。このようなデータをみたら、何か「おかしい」と気付くべきだね。

Alt tag
Alt tag

なるほど~。どの程度の症例数が減っていたら、「おかしい」と判断できるんでしょうか。

残念ながら、具体的な数値は明示されていないんだ。論文をいくつも読めば、徐々に感覚が掴めるようになるだろう。

Alt tag
Alt tag

わかりました!臨床試験の論文を読むときは,今回教えて頂いたことに注意しようと思います。

ただ、脱落例の割合がどの程度あれば品質が担保されるか、ということについて、参考にできるものはあるんだ。
米国内科学会が定期的に発行しているACP Journal Clubでは、掲載基準に合致するRCTを品質の高い試験として内容を紹介しているんだ。

Alt tag

ACP Journal Clubの掲載基準

check-solid-orange.svg

   比較群へのランダム割付

check-solid-orange.svg

   80%以上の追跡率

check-solid-orange.svg

   臨床的に重要な評価項目 など

80%以上の追跡率、つまり脱落率は20%を超えないように、というのを1つの目安にするのはどうだろう。

Alt tag
Alt tag

なるほど!でも実際に、短期間で症例数が「激減」することはあるのでしょうか??

それが意外にも結構あるの。このグラフを見てどう思う?

Alt tag
Alt tag

図 冠動脈疾患の累積イベント追跡例の急激な減少

Alt tag

あれ!5年を境に症例数が1/3まで大きく減っていますね。何があったのでしょうか?

この臨床試験は5年の予定で開始されたが、5年の終了時に両群間の差が明確にならず、試験期間を延長したんだ。登録症例には、5年間の期限付きでインフォームドコンセントをとっていたため、試験延長のためには再度同意をとる必要がある。
2/3の症例で延長の同意をとれず、抜け落ちてしまった、と考えられるね。

Alt tag
Alt tag

この試験は、6年目のフォローアップ症例数が両群とも850前後ですが、通常、同意をとれなかった人数が同じくらいになるものなんでしょうか?

重要なポイントに気付いたね。そこが試験延長の問題点なんだ。
再同意をとる際に、比較する二つの群で同じ人数、同じリスクを有する患者が同じように抜け落ちるなら良いが、実際には再同意後の二つの群を等質にする方法はない。

Alt tag
Alt tag

対象が均一になるよう、せっかく無作為割付けしたのに、なんだか意味がなくなってしまう気がしますね・・・

そうだね。試験の延長が禁止されているわけではないが、試験の品質を高めるためには、開始前の計画が非常に重要ということだね。

Alt tag
Alt tag

なるほど~よくわかりました!
先生方のおかげで、Kaplan-Meier曲線が理解できました。ありがとうございます!

では、最後に今回のまとめです。

Alt tag

第5回「Kaplan-Meier曲線を理解する」まとめ

  1. Kaplan-Meier曲線は時間経過と共に死亡などのイベントを起こさなかった人の割合を推定する方法であり、次のような特徴を持つ。
    1. 曲線内であれば任意の時点のイベントを起こさなかった人の割合が推定可能
    2. 観察開始時点が揃っていなかったり、観察期間が完全に同じでなかったりするデータでもイベントを起こさなかった人の割合が推定可能

  2. 「打ち切り」とは、イベント発生なしに観察されなくなることで、以下のような場合に生じる。
    1. 脱落(引っ越し、同意撤回、行方不明など)による観察中断
    2. 試験終了に伴う観察中断

  3. Kaplan-Meier曲線の描画手順
    1. データ準備:各症例の試験参加時点を揃えて、イベントの発生又は脱落までの期間を計算する。
    2. 評価値の修正:生存確率1(100%)から曲線描画を開始し、イベントが発生する都度生存確率を再計算し、曲線に反映させる。
    3. 打ち切り症例の表示:グラフ上にひげを付加し、残存症例数(リスク集合の大きさ)の時系列推移をグラフ外に記載する。

  4. Kaplan-Meier曲線の打ち切りやリスク集合の大きさ等を時間経過と共に吟味することで、当該臨床試験の信頼性をある程度評価することもできる。

参考資料

1) 山崎力、小出大介:臨床研究いろはにほ、ライフサイエンス出版、2015