<aside> <img src="/icons/playback-play-button_blue.svg" alt="/icons/playback-play-button_blue.svg" width="40px" /> 講義を観よう

<aside> <img src="/icons/save_blue.svg" alt="/icons/save_blue.svg" width="40px" /> 講義動画で用いたSASプログラム

RCRNS_01_2.sas

</aside>

<aside> <img src="/icons/book_blue.svg" alt="/icons/book_blue.svg" width="40px" /> ポイント

p値と仮説検定は、二者択一の判断において、αエラー(差がないのに差があると判断する誤り)を有意水準以下に制御するための方法です

多くの臨床研究ではp<0.05で有意差を判定しますが、これは有意水準を5%と設定することと同じ意味です

サンプルサイズの計算は、βエラー(差があるのに差がないと判断する誤り)を制御するための方法です

【メモ】モデルベースの推測とランダム化ベースの推測

統計的推測の基盤は主に2つあり、それぞれモデルベースのアプローチとランダム化ベースのアプローチと呼ばれています。前者は、現実の状況を(確率分布を用いて)数学的に定式化するものです(この定式化を統計学では「モデル」と呼びます)。データがどのような確率分布に従うのか正しく特定できれば、その確率分布に適した統計手法を導くことはそれほど難しいことではありません。ここで重要になるのはモデルが正しいかどうかです。たとえばt検定は平均の差が0かどうかの検定ですが、確率計算が妥当であるためにはデータが正規分布に従うことが前提です。この場合妥当であるとは、t検定によってαエラーが有意水準以下に保たれるという意味です。ところが、当てはめたモデル(正規分布)が間違っていると、αエラーがコントロールできるという保証はありません。

一方、ランダム化ベースのアプローチの代表例は、並び替え検定やFisherの正確検定です。これらは、ランダム化が人工的な確率分布を生じさせることを利用して、p値を正確に計算する手法です。

ランダム化を伴わないコホート研究やケース・コントロール研究では、推測の基盤としてモデルに頼らざるを得ません。後述する「未測定の交絡因子がない」という前提条件も、統計的にみればモデルの一部です。

</aside>

<aside> <img src="/icons/help-alternate_blue.svg" alt="/icons/help-alternate_blue.svg" width="40px" /> 理解を確認するためのクイズ1

以下の文章の[ ][ ]に入る単語の正しい組み合わせを選びましょう。

p値とは、[  ]の下で、観察されたデータより[  ]差が生じる確率である。

  1. 帰無仮説・極端でない
  2. 対立仮説・極端な
  3. 帰無仮説・極端な
  4. 対立仮説・極端でない

<aside> <img src="/icons/help-alternate_blue.svg" alt="/icons/help-alternate_blue.svg" width="40px" /> 理解を確認するためのクイズ2

p値の説明として正しいものは、次のうちどれでしょうか

  1. 帰無仮説が正しい確率である
  2. 対立仮説が正しい確率である
  3. 0.05よりも小さいと有意差があると判断する
  4. すべて誤り

<aside> <img src="/icons/help-alternate_blue.svg" alt="/icons/help-alternate_blue.svg" width="40px" /> 理解を確認するためのクイズ3

片側検定のp値から、両側検定によるp値を計算するにはどうすればよいでしょうか

  1. 片側検定のp値を2倍する
  2. 片側検定のp値を2で割る
  3. 計算できない
  4. 1~3すべて間違い

<aside> <img src="/icons/help-alternate_blue.svg" alt="/icons/help-alternate_blue.svg" width="40px" /> 理解を確認するためのクイズ4

サンプルサイズを計算するときに必要でないものは、次のうちどれでしょうか

  1. 検出力
  2. p値
  3. 有意水準
  4. 検出したい治療効果の大きさ