- 2021年8月24日
【解説】仮説探索と仮説検証|検証的試験とは?
あらゆる研究で幾度となく主張される「有意」 significant という言葉は,そのすべてが等価というわけではありません。それが仮説「検証的」なものなのか,仮説「探索的」「提唱的」なものであるかは,必ず区別することが重要です。
基本的な統計の考え方や,エビデンスとの付き合い方について扱います。 やわらかな解説を心がけています。 案内役として三匹のネコが登場することがあります。 内容は全体的に【医療統計】寄りです。
あらゆる研究で幾度となく主張される「有意」 significant という言葉は,そのすべてが等価というわけではありません。それが仮説「検証的」なものなのか,仮説「探索的」「提唱的」なものであるかは,必ず区別することが重要です。
臨床医学における〈尤度比〉とは何か? 実臨床でどのように使うのか?詳しく解説します。重要なポイントは,尤度比は事前オッズと事後オッズの比として解釈できるということです。
検査や所見の〈感度・特異度〉は,コンセンサスのあるリファレンス・スタンダードに照らし合わせて算出されたものです。しかしその「照らし合わせ」の過程でバイアスが入り込む余地がなかったかの確認は必須です。そうでなければ,不当に高い感度・特異度を鵜呑みにしてしまうことになるかもしれません。
感度・特異度は,それが「どのようなリファレンスに対するもの」で「どのような患者集団を対象にしたもの」なのかによって,大きく変動します。
感度・特異度は誤解の多い概念です。感度や特異度というものは「すでに診断がついている」ものを「どれだけ正確に拾い上げられたか」という指標に過ぎません。しかし現場で重要なのは「検査が陽性のとき本当に病気である確率」の方であり,順序が逆になっています。
ランダム化比較試験 RCT の結果を批判的に吟味するとき,非常に重要な考え方の1つは「サンプルサイズは必要十分か?」です。サンプルサイズは小さすぎても大きすぎても問題です。その問題について解説します。
パワー分析とは〈統計学的に有意な差〉を示すために必要十分なサンプルサイズを予め計算しておくことです。ランダム化比較試験のデザインに関わる重要な知識である検出力(power)とサンプルサイズについてまとめます。
信頼性の高いエビデンスとされる RCT ですが,限界を知らずに結果を鵜呑みしてしまうと危険です。特に大きな問題となりやすい5つの限界についてまとめます。
エビデンスの王様とされるランダム化比較試験 RCT の特長をまとめます。ポイントは「バイアスのリスクが低い」「交絡因子の影響を受けにくい」ということです。
αエラーは「本当はない」差を「ある」と言ってしまう間違い。βエラーは「本当はある」差を「ない」と言ってしまう間違いです。いずれも推測統計では確率的に起きてしまいます。研究者は慣例的に「許容できる線引き」を決めており,多くの研究で前者は 5 %,後者は 20 %までが許容範囲とされます。