- 2020年12月31日
【解説】αエラーとβエラー;第一種過誤と第二種過誤とは
αエラーは「本当はない」差を「ある」と言ってしまう間違い。βエラーは「本当はある」差を「ない」と言ってしまう間違いです。いずれも推測統計では確率的に起きてしまいます。研究者は慣例的に「許容できる線引き」を決めており,多くの研究で前者は 5 %,後者は 20 %までが許容範囲とされます。
統計に関するごく初歩的な内容をなるべく丁寧に解説するシリーズです。数式の登場率は低めです。案内役として三匹のネコが登場することがあります。
αエラーは「本当はない」差を「ある」と言ってしまう間違い。βエラーは「本当はある」差を「ない」と言ってしまう間違いです。いずれも推測統計では確率的に起きてしまいます。研究者は慣例的に「許容できる線引き」を決めており,多くの研究で前者は 5 %,後者は 20 %までが許容範囲とされます。
「コインを 5 回連続で投げた時,5 回連続でオモテまたはウラが続いた」…このとき私たちはイカサマを疑うでしょうか。「ある2つの野球チームが 15 回連続で試合をした時,戦績は10勝5敗だった」…このとき,両チームの実力に差があると言えるでしょうか。実際に確率を計算し,有意水準 5 %で判断してみます。
今やどんな研究論文でも必ず目にする「統計学的に有意」significant という言葉。この概念を厳密に理解するためには,標本調査,推測統計,統計学的仮説検定,p値,その他いろいろなことを理解しなければなりません。順に解説していきます。
リスクとオッズの違いをまとめた記事です。一言で言えばリスクは〈割合〉,オッズは〈比〉。オッズ比は〈比の比〉であり,直感的な解釈は全くできないことに注意が必要です。オッズ比 ○○倍!を数字通り受け取ると,大きな誤解をしてしまいます。
特に誤用の多い【割合 proportion】と【率 rate】と【比 ratio】の違いについて,簡潔にまとめます。さらに紛らわしい【有病率 prevalence】や【罹患率 morbidity】についてもその違いについて解説します。
データの分布についてグラフを用いずに一言で説明するには〈代表値〉と〈散布度〉を併記します。正規分布のデータと最も親和性の高い〈散布度〉である〈標準偏差 SD〉について,その算出方法や概念について解説します。