<aside> <img src="/icons/playback-play-button_blue.svg" alt="/icons/playback-play-button_blue.svg" width="40px" /> 講義を観よう

<aside> <img src="/icons/alert_blue.svg" alt="/icons/alert_blue.svg" width="40px" /> ポイント

エラーバーには標準偏差、パーセンタイル、標準誤差、95%信頼区間の4つが使い分けられます

臨床研究でもっともよく用いられるのは95%信頼区間です

中央値、25%点、75%点などのパーセンタイルは、外れ値の影響を受けにくいという特徴があります

【メモ】データの型

アウトカムはデータの型によって4種類に分類されます。すなわち、連続データ(例: 血圧)、2値データ(例: 有害事象の有無)、計数データ(例: 骨折発生率)、生存時間データ(例: 再発までの期間)です。データの型によって、正規分布や2項分布など確率分布が異なりますよね。そのため、用いられる統計手法もデータの型に応じて使い分けられます。

【メモ】データの型と確率分布

データの型によって想定される確率分布は様々です。代表的なものは、正規分布(normal distribution、連続データの分布)、2項分布(binomial distribution、2値データの分布)、Poisson分布(計数データの分布)、指数分布(exponential distribution、生存時間データの分布)の5つです。データの分布になんらかの確率分布を仮定し、それに基づいて構成される統計手法をパラメトリックな手法と呼びます。一方、確率分布を仮定しない統計手法をノンパラメトリックな手法といいます。

</aside>

<aside> <img src="/icons/help-alternate_blue.svg" alt="/icons/help-alternate_blue.svg" width="40px" /> 理解を確認するためのクイズ1

平均±標準偏差、平均±標準誤差、95%信頼区間のうち、エラーバーの長さについて正しいのは、次のうちどれでしょうか。 ただしデータの数は4以上とします

  1. 95%信頼区間 > 平均±標準偏差 > 平均±標準誤差
  2. 95%信頼区間 > 平均±標準誤差 > 平均±標準偏差
  3. 平均±標準偏差 > 平均±標準誤差 > 95%信頼区間
  4. すべて誤り

<aside> <img src="/icons/help-alternate_blue.svg" alt="/icons/help-alternate_blue.svg" width="40px" /> 理解を確認するためのクイズ2

下に示されているデータは、東京マラソンに参加した16人の選手のタイムです。16人の選手の平均タイム±標準偏差と95%信頼区間を計算し、正しいものを選びましょう

選手1 2時間32分 選手2 3時間08分 選手3 3時間22分 選手4 2時間02分 選手5 3時間33分 選手6 2時間42分 選手7 3時間12分 選手8 3時間38分

選手9 4時間00分 選手10 3時間56分 選手11 4時間58分 選手12 4時間02分 選手13 3時間49分 選手14 4時間17分 選手15 4時間44分 選手16 3時間42分

  1. 平均±標準偏差2時間36分±45分、95%信頼区間2時間03分~3時間09分
  2. 平均±標準偏差3時間06分±15分、95%信頼区間 2時間43分~3時間39分
  3. 平均±標準偏差3時間36分±46分、95%信頼区間 3時間13分~3時間59分
  4. 平均±標準偏差4時間06分±15分、95%信頼区間3時間43分~4時間29分
  5. 平均±標準偏差4時間36分±45分、95%信頼区間4時間03分~5時間19分