【告知】αエラー・βエラーの解説動画を公開しました

告知

約2ヶ月ぶりとなってしまいましたが,医療統計の解説動画を Youtube に投稿しました!🐮(牛歩の顔)

今回のテーマは

αエラー・βエラーとは何か?

です。統計学的に有意という言葉を見聞きした時,必ずセットで考えなければならない極めて重要な基本概念ですね。

これをわからないまま「有意」だの「有意でない」だのと論じることはできません。

統計を用いた医学論文では必ず Method に「何%のαエラー,何%のβエラーを許容した power 解析でサンプルサイズいくつ必要と見積もって云々…」だとか「αエラーを全体で5%未満にするため中間解析の際に多重検定の補正でXX法を用いて云々…」といった記載があるはずです。

そうした混み入った内容に入っていく前に,まず最初のハードルを極限まで低くして見ていただけるような内容に仕上げました(▼)。

以前に以下の記事(▼)でも取り扱った内容ですが,より詳しく動画でまとめた形です。

合わせて読みたい

この記事では 〈αエラー〉と〈βエラー〉とは何なのか? ということについて,基本的内容に絞ってまとめます。 さらりと解説されて終わってしまうことが多い概念ですが,その本質的な部分をしっかり理解しておかないと,研究結果の解釈に大きな誤解[…]

当初は「主要エンドポイント primary endpoint」と「二次エンドポイント secondary endpoint」について解説した動画を作る予定でしたが,αエラーとβエラーの解説を飛ばしてその内容の解説は不可能であると考え,先にこの動画を作りました。

動画の構成

構成は以下の通りです。

動画の構成
  • 00:18|導入
  • 01:28|統計学的仮説検定の復習
  • 02:01|仮説検定の4STEP
  • 02:50|統計学的に有意とは
  • 03:25|p値が十分に小さいとは
  • 03:49|αエラーとは
  • 07:11|βエラーとは
  • 10:24|αエラーとβエラーの慣例
  • 10:47|αエラーの社会的影響
  • 11:50|βエラーの社会的影響
  • 12:48|αエラーとβエラーのバランス
  • 13:03|具体的な問題例
  • 15:43|結論

合計16分程度ですが,1.5倍速〜 2倍速で見ていただく前提で作成しています。つまり 8〜10 分程度でざっくり概要を抑えられる,大変オトクな動画となっております。

今回の見どころ

今回の見どころは,αエラーとβエラーを考える前,P値を計算する時点での「前提条件」を強調した部分(4:57〜と7:54〜)です。

─ ads ─

P値計算の前提

P値というのは基本的に「観察データと特定の統計モデルが矛盾する程度を示す指標」でしかありません。そしてP値を計算する際の前提条件(=確率統計モデルの前提)として,以下は組み込まれたものになっています。

  • 標本はランダム抽出されている
  • 介入群とコントロール群への割り付けはランダムにされている
  • 途中脱落や欠測に偏りバイアスがない
  • その他,問題となるバイアス(*)がない
治療群と介入群のその他のフォローがフェアになっていない,盲検化されておらずプラセボ効果やホーソン効果の影響をがっつり受けている,などなど

その上で

帰無仮説が正しい(=母集団では両群の介入に差などない)

ということを更なる前提条件としてモデリングを行い,特定の統計モデルでP値を計算します。

このような経緯で得られたP値が小さければ,それはつまり「手元に得られた観察データとその統計モデルが矛盾する程度が大きい」ということを意味します。つまり,前提条件に何かおかしなところ、、、、、、、、、があったはずだと考えられます。

しかし今,理想的なRCTであれば,上記の前提条件は全て満たされていますから,今回この統計モデルで間違っていた部分があるとしたら「帰無仮説が正しい」という所でしかありえません。

だからこそ「P値が十分低い(=手元のデータと統計モデルの矛盾が大きい)」とき,帰無仮説が棄却できるわけです。そしてこれによって,「介入群と対照群のアウトカムの差」は手元の標本のみならず母集団でもきっと生じるはずである,と推論することができます(▼)。

まずはこうした基本的なロジックとその前提条件が極めて重要であって,その上でなおαエラーとβエラーの問題が生じる,ということを押さえる必要があります。

実際には母集団から完全にランダムな抽出はできない(=治験に参加できるという時点で選択バイアスがある)上,脱落や欠測はたくさん生じますし,他のバイアスも多数で,最終的な統計モデル自体が妥当でないこともたくさんあります。これらはαエラー・βエラーを論ずる「以前」の重大な limitation であることを忘れてはなりません。エラーとバイアスはそれぞれ別の limitation です。むしろ「バイアスが全て排除されていてもなおαエラー・βエラーの問題が最後に残る」という認識です。

基本的な部分を大切に

今回,安直に「αエラーは有意でないものを有意と言ってしまうこと」などとメチャクチャに端折った解説を行ってもよかったのですが,根本的な論理構造からきちんと押さえて話をしたいという気持ちがありました。そのため,動画中ではあえて時間をかけてその点を強調してみました。

毎度毎度「推測統計」の枠組みの話から始めているのは,こういう基本的な前提を疎かにしたくないというちょっとしたこだわりあってのものです。

以前の動画もご覧いただいている視聴者の方は「またか」とクドく感じてしまったかもしれませんが,ご容赦いただければ幸甚です。

次回予告

今後も引き続き

シリーズ「RCTを吟味する」

と題して動画を投稿していきます。当面はアウトカムに関する部分に着目し以下(▼)の内容を複数回に分けて構成し直していく予定です。

合わせて読みたい

この記事では,「医学系 RCT を正しく読む」ための必須知識となる,エンドポイントの種類についてまとめます。 エンドポイントの種類まとめ 真のエンドポイントと代用エンドポイント ハードエンドポイントとソフトエンドポイント 主要エンドポイ[…]

次回こそ本当に,primary endpoint,secondary endpoint について取り上げる予定です。またチェックしていただけたら嬉しいです。よろしくお願いします!

登録者1350人達成

なお二人体制で進めてきたこのYoutube チャンネルですが,なんといつの間にかチャンネル登録者が1350人を超えました!👏

8月ごろに1000人超えたワーイ!🤗と思っていたのも束の間,本業で駆られ倒して投稿できず枯れているうちにジワジワ伸びて,気づいたら1350人を超えておりました。とても嬉しいです。本当にありがとうございます。

2ヶ月に1本,これまで合計11本しか動画投稿していないのにこれだけの方に更新をお待ちいただいているのは本当に身が引き締まる思いです。

これからも少しずつ動画作成を続けたいと思いますので,今後とも何卒よろしくお願い致します🙇‍♀️🙇

なお一応 Youtube は「チャンネル登録者数1000+連続年間4000時間再生」で広告が入れられるようになるのですが,後者が全然満たせていないため収益は全くありません😅使用している動画作成ソフトが年間 650ドル(円安があかん。本当にあかんです)も貪ってくるため,この大幅赤字を賄えるようにいつか広告を入れさせていただけたらなあとは思っておりますが…まだまだ先の見込みです。
※共同制作者のブログはこちら

[おすすめ本紹介]

Users’ Guides to the Medical Literature


タイトル通り「医学論文を現場でどう応用するか?」迷える臨床家のためのユーザーズガイド。Tips 集のような構成で,どこからでもつまみ読みできます(通読向きではない)。医学論文の批判的吟味を学ぶにあたり 1 冊だけ選ぶならコレ,という極めて網羅性の高い一冊です。著者 Gordon Guyatt 氏は “EBM” という言葉を作った張本人。分厚い本ですが,気軽に持ち歩ける Kindle 版はオススメです。邦訳版もあります。

医学文献ユーザーズガイド 第3版


表紙が全然違いますが「Users’ Guides to the Medical Literature (JAMA)」の邦訳版。医学文献を批判的吟味するためのTips集としてかなりの網羅性を誇る代表的な一冊です。唯一の欠点は Kindle版がないこと(英語版はある)と,和訳が気になる部分が結構あること。2つでした。原著とセットで手に入れると最強の気分を味わえます。鈍器としても使えます

─ ads ─
>医療統計の解説チャンネル

医療統計の解説チャンネル

スキマ時間で「まるきりゼロから」医療統計の基本事項を解説していく Youtube チャンネルを 2 人で共同運営しています。

CTR IMG