告知
告知です。医療統計の解説動画を Youtube に up しました。
今回のテーマは
です。
95%信頼区間とは
95%信頼区間は,あらゆる科学論文で非常によく見かける概念ですが,実は解釈が難しく,かなりの割合で誤解されてしまっているものでもあります。
たとえば
この新薬の血圧降下作用は 平均 15 mmHg [95%CI 7-23 mmHg] です!
という時,その言葉の意味は
この新薬を飲めば 95%の確率で 7-23 mmHg の血圧降下作用が得られる
ということではありません。
非常に多い誤解ですが,95% の意味するところは「確率」ではない,ということです。
ではどういう意味か?というと,これがなかなか,一言で説明することが難しいんですね。
95%信頼区間の意味
95%信頼区間の教科書的な説明は,以下のようになります。
- 手元にとある標本があり,その標本平均は \(\bar{X}\) である
- この標本平均 \(\bar{X}\) は,母集団からランダム抽出して偶然得られたデータ(確率的な変数)である
- そしてこの標本データは,母集団から「5% 以下の確率」でしか得られないような極端なデータが得られたものではないはずと考える
- そのような前提に立った場合,手元の標本が「目の前に実現している」という事実から逆説的に考え,「さすがにこの範囲外に母平均があるとはいえないだろう」という部分を推定することができる
- その範囲を95%信頼区間と呼ぶ
…… とまあこんな具合で,言葉を並べ立てたところで非常に分かりにくくなってしまうだけです😅
しかし,動画というのは素晴らしい情報伝達ツールです。
字面ではよく分からない上記の説明も,動画で見ていただければイメ─ジして頂きやすくなるのではないかと思い,今回の動画を作成しました。
95%CI は「変数」
動画で重点的にお伝えしたかった部分は,95%信頼区間は「変数」にすぎない,ということです。
95%信頼区間は,要するに手元の標本平均 \(\bar{X}\) (点推定値)から左右に 1.96 SE だけ距離をとって得られる「変数」であり,この区間が本当に真実の値(=母平均 μ)を含んでいるかどうかは分かりません。
手元の信頼区間が「きちんと母平均を含んだもの」になっているのかどうかは2つに1つであって,何%の確率で含んでいるか,などというものは分かりません。
そもそも母集団を直接調査しているわけでない以上,母平均(=真実)は永久に不明です。それゆえ手元の標本データから算出された 95%CI が「本当に母平均を含んでいるのか?」ということを言い出しても,わからない。神のみぞ知る,という話になってしまいます。
そうした限界を知らないまま,「95%信頼区間」をあたかも「95%正しい値を含む区間」であるかのように解釈してしまうと,手元のデータに対する姿勢・感じ方が大きく歪んでしまう可能性があります。
この点は統計リテラシーという観点でも確実に押さえておきたいポイントです。
他にも注意点あり
また,信頼区間はその性質上
- そもそもランダム抽出して得られたものでなければ意味の解釈が難しい
- サンプルサイズを大きくすれば区間は狭くなる
といった特徴があります。
今回の動画を1本通して見ていただくと,95%信頼区間の意味はもちろんのこと,こうした注意点についても一通りおさらいすることができる構成になっています。
前回の動画との連続です
なお,この動画は1つ前の動画「標準誤差 SE」の内容を基本的に既知のものとして扱っていますので,合わせてチェックしていただけたら嬉しいです。
チャンネル登録も是非!よろしくお願いいたします 🙇♂️🙇♀️
次回予告
これまで1年かけて8本の動画でド基礎的内容のおさらいをしてきましたが,こうした基本的な内容のおさらいは,ひとまず今回で一段落とします。
「医療統計」というよりむしろむしろ普通の統計基礎みたいな内容になってしまっていたので…😅
今後は実際の臨床試験論文の批判的吟味のポイントにフォーカスを当てた動画を増やしていきたいと思います。
また次回もお付き合いいただけたら嬉しいです。
なお今回の動画に関しても数理的背景の補足説明は,共同制作者がブログで行なっていますので,興味のある方は是非…
今回もまたなかなか時間を要してしまいましたが、新しいyoutube動画公開しました。 今回のテーマは95%信頼区間です。…
余談
最近年度末で色々と忙しく,当ブログでも告知ばっかして記事更新していない‥という反省があります。笑 ので,また近々きちんとした記事も up したいと思います。がんばります。