RCT の長所
前回の記事で,ランダム化比較試験 RCT の満たすべき条件として,以下の4つを挙げました。
- ランダム化されている
- 比較対照(control群)がある
- 明確な評価項目(エンドポイント)がある
- (可能な限り多重の)盲検化が望ましい
このような条件を満たした RCT がエビデンスの王様と位置づけされる(▼)のには理由があります。
それは,RCTというものが構造的に
- 「バイアスのリスクが低い」
- 「交絡因子の影響を受けにくい」
ためです。
今回はこれらの長所についてまとめてみます。
長所①:バイアスのリスクが低い
そもそもバイアスとは?
バイアスとは,日本語では「偏り」といわれるものです。
厳密には,単に偏っているというという意味ではなく,「一定の方向性」を持って〈系統的にズレている〉,という意味です。
生体などを対象にした実験を行うと,確率的に結果がバラつくことはよくありますが,そのようばバラツキは〈偶然誤差〉と呼び,〈系統的誤差〉とは区別されます(▼)。

確率的・不確定なものを対象にしている以上,偶然誤差(ランダムエラー)は避け得ませんが,バイアスはなるべく構造的に排除する必要があります。
科学において何よりも重要なのは,客観的であることです。
研究者やスポンサー,メーカーは「効果」を示したいと考えているため,どうしてもそういう方向性に結果は歪められます。
彼らが示そうとしている「効果」に対し,意図的にプラスの影響を与える様なバイアスが入り込む余地を,いかに排除できているか?
「エビデンス=科学的根拠」を適切に読んで適応するには,そういう「バイアスリスク」の吟味が非常に重要となります。
バイアスはいつ生じるか?
ここで,
ということが重要です。
「あらゆるプロセス」とはつまり,
- 「試験対象者の選択」
- 「割り付け」
- 「データの収集」
- 「データの分析」
- 「報告」
全てのタイミングです。
しかし RCT は少なくとも「割り付け」に関しては完全にランダムなので,非ランダム化比較試験 NRCTよりもバイアスのリスクが低く,信用性が高くなるというわけです。
割り付け以外のバイアスには個別の対処が必要
ただし,「割り付け」以外のプロセスで生じるバイアスは,ただ RCT というだけでは排除できません。
それぞれ個別の対処が必要です。
そうした対処法がきちんと行われているのか?という点も『RCT の質』を判断する上で重要となります。
※また少し混み入った話になりますので,個別に別項で扱いたいと思います。
職場の論文抄読会で,臨床試験論文の〈批判的吟味 critical apprausal〉をしたい!でもどういう部分に気をつけて読めばいいか分からない!そんな時,臨床試験の質を『爆速で』チェックできる手頃なリストがあったら,便利[…]
- |他のプロセスで生じるバイアスへの対処例
- 中央割り付け方式による隠蔽化 ──「割り付け」時に恣意的選択を排除
- 多重盲検化 ── データ報告時に主観や希望が入り込む余地を排除
- IPCW 法 ──「データ収集」時に起きる「欠測」が結果に与える影響を考慮
- ITT解析 ──「分析」の際,群間移動などによるバイアスを除外
前向き試験である強み
またランダム化比較試験 RCT は〈前向き試験〉です。
そのため〈後付け解析〉post-hoc analysis を行わない限りは,あらかじめ提出されていたプロトコルと違う「都合のよい統計解析」を行う余地が少ない,というのもポイントです。
これにより〈後ろ向き研究〉と比べてかなりバイアスが入り込む余地が小さくなっています。
・多重検定が行われた上でひねり出された「有意差」か分からないからです。
長所②:交絡因子の影響を受けにくい
RCT の 2つめの長所は「交絡因子の影響を受けにくい」ということです。
交絡因子とは「調べたい要因以外に関与する因子」のことです。
運動習慣 と 健康意識 と 脳卒中
たとえば「運動習慣」と「脳卒中の発症率」の関係を調べる時のことを想定してみましょう。
「健康診断時に記載してもらったアンケート結果」など疫学的なビッグデータから,この二つの関係性を解析してみます。
この観察研究では,実際に「運動習慣がある人」の方が,生涯の「脳卒中の発症率が低い」傾向にありました。
さて,ここでこのデータの解釈が問題になります。
これは
「運動習慣があった :A」から「脳卒中になりにくかった :B」
のでしょうか?
それとも
「運動習慣がある人 :A」は
「健康志向が高いため,喫煙をしない傾向にあった :C」から
「脳卒中になりにくかった :B」
のでしょうか?
因果関係と相関関係
前者の解釈では,「 A ➡︎ B は真の “因果関係”」と言えます。
しかし現実には後者だとすると,「A ➡︎ B に “相関関係” はあるが,真の “因果関係”には C が大きく影響している」ということになります。
つまり本当のところの A と B の因果関係は不明です。
この例における喫煙習慣(C要素)の様に「隠れた因果関係の要素」のことを,一般に〈交絡因子〉と呼びます。
観察研究でも〈既知の交絡因子〉は調整できる
今回の様に「喫煙しているかどうか」など予め想定されやすい〈交絡因子〉に関しては,最初からデータを収集しておけば,大きな問題はありません。
あとから「同じくらい喫煙する人同士で,運動習慣が有るか無いかでリスクが変わるか比較」といった解析をすることはできるからです。
” C 要素を揃えた” 縛りの上で「運動習慣 :A」と「脳卒中の発症: B」の関連性を調べる ── といったことは,統計ソフトを使えば,さして労せずに可能です。
観察研究では〈未知の交絡〉を調整できない
しかし実際には 想像できていない〈未知の交絡因子〉 D,E,F,,, がある可能性は,常に否定できません。
そして,そうした全ての〈交絡因子〉を予め想定した上でデータを集めておいて,あとで調整する,などということは現実には不可能です。
結局のところ〈観察研究〉ではこの〈未知の交絡〉を調整することができないために,「本当に直接的な“因果関係“があるのか?」は常に不透明なのです。
ということです。
RCT なら “トータルで” 均等に割り振れる
しかしサンプルサイズが十分に大きい RCT であれば,こうした隠れた交絡因子 C,D,E,F,,, すらも両群均等に割り振ってくれます。
両群が「トータルではバランスが取れている」という状態にしてくれるのです。
そのため〈観察研究〉と比べて格段に交絡因子の影響を受けにくく,エビデンスとしての信用性が高くなるわけです。
【補足】トータルで均等とは?
- 一例として,ある新規の降圧薬 A と,従来型の降圧薬 B の効果を比較した RCT を考えてみます。この試験の主要評価項目は「心血管イベント(心筋梗塞・脳梗塞・心血管死亡の複合)」であったとします。
- このとき,ベースラインの年齢や血圧,過去の心血管イベントの既往症の有無などが,A 群と B 群で大きく違っていたら解釈に困ることになります。
- その場合,アウトカムに差があったとしても,その差は本当に「薬の効果による差」なのかわかりません。もともとのベースラインの差が検出されてしまっているだけの可能性があります。
- しかしサンプルサイズが十分に大きい RCT であれば,「年齢では A 群が不利」でも,「ベースの血圧では B 群が有利」,というようにトータルでのバランスは保たれることになります。
- これにより〈未知の交絡〉すらも含めた上で「総体として均等な 2 群にしてくれる」という威力があるのです。
- |補足
- 論文を読んでいる時に「えっ?この背景因子だけは絶対に揃ってないとマズいのでは…?」という limitaion に気付けるかどうかは,論文読者のリテラシーが問われる部分だと思います。専門外の分野の論文だとなかなか気づきにくい場合もあり,むずかしい問題です。
RCT だけが仮説を〈検証〉できる
ここまでみてきたように, RCT は構造的にバイアスを排除する力が強いため,エビデンスの王様とされています。
そして何よりも重要なことは,統計的に適切な手法で仮説の〈検証〉ができるのは RCT だけである,ということです。
なのです。
仮説検証と仮説提唱
先述したように〈後ろ向き研究〉はどれもバイアスリスクが極めて高いため,〈仮説提唱〉はできても〈仮説検証〉はできません。
また〈前向き研究〉であったとしても,〈観察研究〉では,交絡因子を除外できず〈因果関係〉の直接的証明はできません。〈相関関係〉を示すのみです。
〈前向き研究〉かつ〈介入研究〉である RCT だけが,仮説を〈検証〉することができます。
とくに,適切な対照群を用意した二重盲検以上の RCT は,仮説の〈検証〉ないし〈立証〉に関して最も有効な手段です(▼)。

創薬は RCT
だからこそ,創薬の最終段階といわれる第 III 相試験では,プラセボ比較の二重盲検 RCT で有意差を示すことが「薬事承認」のための大切な要件とされています(▼)。

RCT の長所まとめ
以上です!
一言でまとめると,バイアスと交絡因子を排除する力が強いのが RCT の特長だと言えます。
この 2 つのポイントのために, RCT は唯一〈仮説検証〉に使える研究手法とされています。
RCTの限界は?
本項では RCT の特長を主に取り上げて参りましたが,RCT も残念ながら万能な研究手法ではありません。
以下に示すような問題点があり,結果の〈解釈〉をするときには相応の注意を要します。
- 莫大なコストがかかる
- 資金源バイアス・実験効果により結果が誇張されやすい
- サンプルサイズの影響が大きい
- 希少なものは相手にできない
- ただ1つの仮説しか〈検証〉できない
次の記事では,これらについてまとめてみたいと思います。
前回の記事では,RCTの特長についてまとめました(▼)。バイアスを排除する力が強い交絡因子を排除する力が強い前向き研究であり直接〈因果関係〉を〈検証〉できる[sitecard subtitle=前回の記事 url=/stat[…]