<aside> <img src="/icons/playback-play-button_blue.svg" alt="/icons/playback-play-button_blue.svg" width="40px" /> 講義を観よう

<aside> <img src="/icons/save_blue.svg" alt="/icons/save_blue.svg" width="40px" /> 講義動画で用いたデータセットとSASプログラム

RCRNS_01.csv

RCRNS_01_1.sas

</aside>

<aside> <img src="/icons/alert_blue.svg" alt="/icons/alert_blue.svg" width="40px" /> ポイント

Kaplan-Meier法、ログランク検定、Cox回帰は「生存時間解析三種の神器」と呼ばれ、特定のイベントまでの期間を解析するために用いられます

生存時間解析の結果をみる前に、イベント・打ち切りの定義やその研究でどの程度の期間追跡がなされたかについて確認しましょう。何人がイベントで、何人が打ち切りだったか、アットリスク数、打ち切りのタイミングを読み取ることも重要です

グラフの右側、つまりアットリスク数が小さい部分では、誤差が大きくなります

追跡を開始した直後に打ち切りがあまり多いと、打ち切りがランダムではなく、バイアスが生じているかもしれません

【メモ】生存関数とハザード関数

なぜ、生存時間データでは特別な統計手法が必要になるのでしょうか?それは、打ち切りがあるためです。仮に打ち切りがなければ、無再発期間はただの連続データですから、平均を比べるだけで十分なのですが、打ち切りがあると平均が計算できませんよね。また、再発の有無(2値データ)として解析すると、再発が早いかどうかという情報が反映されません。そこで導入されたのが、生存確率(survival probability)とハザード(hazard)という数学的概念です。 生存曲線は横軸に時間をとったグラフなので、「時間の関数」の一種とみなすことができます(縦軸についてはクイズで聞きますね)。生存関数とは別にハザード関数というのもあって、こちら「発生率」を時間の関数として扱ったものです。発生率を調べた研究の多くで、イベントが発生するスピードは時間によらず一定と仮定します。1年あたりの交通事故発生率などでは、この考え方は正しいのですが、リツキシマブ投与後の再発は、時間によらず一定とは考えられません。従って、時間の関数と考える方が適切です。ハザード比は、まさに2群間のハザード関数の比をとった指標です。

【メモ】95%信頼区間は必ず対称か?

平均値や回帰係数の95%信頼区間は、「推定値±1.96×標準誤差」で計算することが一般的です。これは推定値が正規分布に近似できることを利用したものです。その一方で、オッズ比、発生率比、ハザード比の95%信頼区間は回帰係数の推定値から計算されるため、「exp(回帰係数の推定値±1.96×標準誤差)」となります。計算に指数変換が含まれると上下対称になりません。論文を読んでいて、比の指標の95%信頼区間が上下対称だったら、間違いを疑うべきかもしれません。

</aside>

<aside> <img src="/icons/help-alternate_blue.svg" alt="/icons/help-alternate_blue.svg" width="40px" /> 理解を確認するためのクイズ1

生存曲線はKaplan-Meier法で計算することができます。さて、生存曲線の縦軸として正しいのは以下のうちどれでしょうか

  1. 割合
  2. ハザード比
  3. 1~3どれも間違い

<aside> <img src="/icons/help-alternate_blue.svg" alt="/icons/help-alternate_blue.svg" width="40px" /> 理解を確認するためのクイズ2

生存曲線はKaplan-Meier法で計算することができます。さて、もっとも追跡期間が長かった対象者でイベント(死亡や再発など)が観察されなかったとき、正しいのは次のうちどれでしょうか

  1. 生存曲線は最終的にゼロになる
  2. 生存時間中央値が計算できない
  3. アットリスク数は最終的にゼロになる
  4. 1~3どれも間違い