【解説】ランダム化比較試験 RCT ３つの長所

｜この記事では RCT の長所 について解説します。

1 RCT の長所
2 RCT の長所まとめ
- 2.1 RCTの限界は？

RCT の長所

前回の記事で，ランダム化比較試験 RCT の満たすべき条件として，以下の4つを挙げました。

ランダム化されている
比較対照（control群）がある
明確な評価項目（エンドポイント）がある
（可能な限り多重の）盲検化が望ましい

このような条件を満たした RCT がエビデンスの「代表的存在」として位置づけされるのには理由があります。

それは，RCT に以下の３つの特長があるからです（▼）。

「バイアスのリスクが低い」
「交絡因子の影響を受けにくい」
「因果関係を検証できる」

今回はこれらの長所についてまとめてみます。

長所①：バイアスのリスクが低い

１つ目の長所は，RCT が他研究と比べてバイアスを排除しやすい点です。

そもそもバイアスとは？

バイアス bias は，日本語では「偏り」と訳されますが，厳密には，単に偏っているというという意味ではなく，「一定の方向性」を持って〈系統的にズレ、、ている〉，という意味です。

生体などを対象にした実験を行うと，確率的ランダムに結果がバラつくことはよくありますが，そのようばバラツキは〈偶然誤差ランダムエラー〉と呼び，〈系統的誤差バイアス〉とは区別されます（▼）。

▲ 偶然誤差（＝ブレ）のみの場合と，バイアス（＝ズレ）もある場合の模式図

確率的・不確定なものを対象にしている以上，偶然誤差（ランダムエラー）は避け得ませんが，バイアスはなるべく構造的に排除する必要があります。

とくに研究者やスポンサー，メーカーは「効果」を示したいと考えているため，どうしてもそういう方向性に結果は歪められます（＝実験効果，資金源バイアス）。

彼らが示そうとしている「効果」に対し，意図的にプラスの影響を与える様なバイアスが入り込む余地を，いかに排除できているか？「エビデンス＝科学的根拠」を適切に読んで適応するには，そういう「バイアスリスク」の吟味が非常に重要となります。

─ ads ─

バイアスはいつ生じるか？

ここで，

バイアスは試験中のあらゆるプロセスで生じる可能性がある

ということが重要です。「あらゆるプロセス」とはつまり，以下全てのタイミングです（▼）。

「研究対象者の選択」
「割り付け」
「データの収集」
「データの分析」
「報告」

しかし RCT は少なくとも「割り付け」に関してはランダムなので，非ランダム化比較試験 NRCTよりもバイアスのリスクが低く，信用性が高くなるというわけです。

ただし「割り付け」以外のプロセスで生じるバイアスは，ただ RCT であるというだけでは排除できません。それぞれ個別の対処が必要です。そうした対処法がきちんと行われているのか？という点は『RCT の質』を判断する上で極めて重要となります。

合わせて読みたい

【30分で】臨床試験 RCT 爆速チェックリスト【批判的吟味】

職場の論文抄読会で，臨床試験論文の〈批判的吟味 critical apprausal〉をしたい！でもどういう部分に気をつけて読めばいいか分からない！そんな時，臨床試験の質を『爆速で』チェックできる手頃なリストがあったら，便利[…]

｜他のプロセスで生じるバイアスへの対処例

中央割り付け方式による隠蔽化 ──「割り付け」時に恣意的選択を排除
多重盲検化 ── データ報告時に主観や希望が入り込む余地を排除
IPCW 法 ──「データ収集」時に起きる「欠測」が結果に与える影響を考慮
ITT解析 ──「分析」の際，群間移動などによるバイアスを除外

前向き試験である強み

またランダム化比較試験 RCT は〈前向き試験〉です。

あらかじめデータ解析のプロトコルが提出されていれば，その後に都合の良い〈後付け解析〉post-hoc analysis が行われたとしても，読者がそれを指摘することができます。これによって「都合のよい統計解析」が好き放題に行われるリスクが少ない，というのもポイントです。

つまり RCT では「データの分析」プロセスにおいても，バイアスが入り込む余地が比較的小さくなっています（※ プロトコルの事前開示がある場合に限る）。

逆に〈後ろ向き研究〉ではいくらでもデータの取捨選択（cherry picking）が可能であるため，どうしてもバイアスリスクは高くなってしまいます。後ろ向き解析の結果で「有意差あり」という結果になっていても，鵜呑みにはできません。そのウラで何度の多重比較・多重検定が行われたかわからないからです。（参照：多重検定の問題）

長所②：交絡因子の影響を受けにくい

RCT の 2つめの長所は「交絡因子の影響を受けにくい」ということです。

交絡因子とは「調べたい要因以外にアウトカムに関与する因子」のことを指します。

運動習慣と健康意識と脳卒中

たとえば「運動習慣」と「脳卒中の発症率」の関係を調べる時のことを想定してみましょう。

「健康診断時に記載してもらったアンケート調査^*」で，「運動習慣がある人」の方が，生涯の「脳卒中の発症率が低い」傾向にあったとします。

しかしこのとき，これは

「運動習慣があった :A」から「脳卒中になりにくかった :B」

のでしょうか？　それとも

「運動習慣がある人 :A」は
「健康志向が高いため，喫煙をしない傾向にあった :C」から
「脳卒中になりにくかった :B」

のでしょうか？

* こうした研究は〈観察研究〉と呼ばれます。一方「実際に被験者に対して○○してもらって結果を確認する」のが〈介入研究〉です。RCTは〈介入研究〉の代表格です。

因果関係と相関関係

前者の解釈では，「 A ➡︎ B は真の “因果関係”」と言えます。しかし後者の場合「A ➡︎ B に “相関関係” はあるものの，直接的な因果関係があるとは言えない」ことになります。実際には C が大きく介在しているからです。

つまり後者の場合「A（運動習慣）を改善したからと言って B（脳卒中回避）という結果が得られる」とは限りません。

この例における喫煙習慣（C要素）の様に「隠れた因果関係の要素」のことを，一般に〈交絡因子〉と呼びます。

観察研究でも〈既知の交絡因子〉は調整できる

今回の様に「喫煙しているかどうか」など予め想定されやすい〈交絡因子〉に関しては，最初からデータを収集しておけば，大きな問題はありません。

あとから「同じくらい喫煙する人同士で，運動習慣が有るか無いかでリスクが変わるか比較」といった解析をすることはできるからです。

” C 要素を揃えた” 縛りの上で「運動習慣 :A」と「脳卒中の発症: B」の関連性を調べる ── といったことは，統計ソフトを使えば，さして労せずに可能です。

層別化解析や，Propensity score match などの手法があります。

観察研究では〈未知の交絡〉を調整できない

しかし，事前に全ての〈交絡因子〉を予め想定した上でデータを集めておいて，あとで調整する，ということは現実にはほぼ不可能です。 想定し切れていない〈未知の交絡因子〉 D,E,F,,, がある可能性は，常に否定できません。

結局〈観察研究〉ではこの〈未知の交絡〉を調整することができないため，「本当に直接的な“因果関係“がある」と証明することが困難です。

RCT なら “トータルで” 均等に割り振れる

しかしサンプルサイズが十分に大きい RCT であれば，こうした隠れた交絡因子 C,D,E,F,,, すらも両群均等に割り振ってくれるのが強みです。

ランダム割り付けという手続きを挟むことにより，両群が「トータルで均等^*が取れている」という状態にすることができるからです。

そのため〈観察研究〉と比べて格段に交絡因子の影響を受けにくく，因果関係の立証に向いている研究デザインです。

｜トータルで均等とは

一例として，ある新規の降圧薬 A と，従来型の降圧薬 B の効果を比較した RCT を考えてみます。この試験の主要評価項目は「心筋梗塞の発症」であったとします。
このとき，ベースラインの年齢や血圧，過去の心血管イベントの既往症の有無などが，A 群と B 群で大きく偏っていた場合，結果の解釈に困ってしまいます。アウトカムに差があったとしても，その差は本当に「薬の効果による差」なのかわかりません。もともとのベースラインの差が検出されてしまっているだけの可能性があるからです。
しかしサンプルサイズが十分に大きい RCT であれば，「年齢では A 群が不利」でも，「ベースの血圧では B 群が有利」，というようにトータルでのバランスは保たれることになります。RCT では〈未知の交絡〉すらも含めた上で「総体として均等な 2 群にしてくれる」のです。

ただしサンプルサイズが小さい RCT はこの限りではありません。重要な背景因子で群間不均衡が出てしまうこともあります。そうした重大な背景因子をなんとしても「均等」に割り振りたい時には，特別の工夫を行う場合もあります（層別化ランダム割り付けなど）。なお論文を読んでいる時に「えっ？この背景因子だけは絶対に揃ってないとマズいのでは…？」という limitaion に気付けるかどうかは，論文読者のリテラシーが問われる部分の１つです。

長所③：仮説〈検証〉に最適

ここまでみてきたように， RCT は構造的にバイアスを排除する力が強いのが特長です。そのため科学的仮説の〈検証〉はほとんど RCT の専売特許になっています。

RCT は〈因果関係〉を直接的に〈検証〉する最も基本的な手法

なのです。

仮説検証と仮説提唱

先述したように〈後ろ向き研究〉はどれもバイアスリスクが極めて高いため，〈仮説提唱、、〉はできても〈仮説検証、、〉は困難です。

また〈前向き研究〉であったとしても，〈観察研究〉では，未知交絡を除外するのが困難であるため〈因果関係〉の直接的証明には向きません。基本的には〈相関関係〉を示すことが限界になります。

しかし〈前向き研究〉かつ〈介入研究〉である RCT は，最もシンプルに仮説を〈検証〉することができます。

とくに，適切な対照群を用意した二重盲検以上の RCT は，仮説の〈検証〉ないし〈立証〉に関して最も有効な手段です（▼）。

創薬は RCT

だからこそ，創薬の最終段階といわれる第 III 相試験では，プラセボ比較の二重盲検 RCT で有意差を示すことが「薬事承認」のための大切な要件とされています（▼）。

RCT の長所まとめ

以上です！

一言でまとめると，バイアスと交絡因子を排除する力が強いのが RCT の特長だと言えます。これにより RCT は〈仮説検証〉に最適な研究手法とされています。

合わせて読みたい

【解説】仮説探索と仮説検証｜検証的試験とは？

この記事では，医薬品に関するリテラシーとして必須知識である「仮説検証」と「仮説探索／提唱」の違いについて解説します。「統計的に有意」は等価ではない医学研究には多くの種類がありますが，ほとんどの研究で最終的に〈統計的に有意[…]

RCTの限界は？

本項では RCT の特長を主に取り上げて参りましたが，RCT も残念ながら万能な研究手法ではありません。

以下に示すような問題点があり，結果の〈解釈〉をするときには相応の注意を要します。

RCT にゼッタイついて回る 5 つの限界

莫大なコストがかかる
資金源バイアス・実験効果により結果が誇張されやすい
サンプルサイズの影響が大きい
希少なものは相手にできない
ただ１つの仮説しか〈検証〉できない

次の記事では，これらについてまとめてみたいと思います。

【注意】ランダム化比較試験 RCT に必ずついてまわる5つの「限界」

前回の記事では，RCTの特長についてまとめました（▼）。バイアスを排除する力が強い交絡因子を排除する力が強い前向き研究であり直接〈因果関係〉を〈検証〉できる [sitecard subtitle=前回の記事 url=/stat[…]

[おすすめ本紹介]

Users’ Guides to the Medical Literature

タイトル通り「医学論文を現場でどう応用するか？」迷える臨床家のためのユーザーズガイド。Tips 集のような構成で，どこからでもつまみ読みできます（通読向きではない）。医学論文の批判的吟味を学ぶにあたり 1 冊だけ選ぶならコレ，という極めて網羅性の高い一冊です。著者 Gordon Guyatt 氏は “EBM” という言葉を作った張本人。分厚い本ですが，気軽に持ち歩ける Kindle 版はオススメです。邦訳版もあります。

Amazon で見る

楽天市場で見る

医学文献ユーザーズガイド第3版

表紙が全然違いますが「Users’ Guides to the Medical Literature (JAMA)」の邦訳版。医学文献を批判的吟味するためのTips集としてかなりの網羅性を誇る代表的な一冊です。唯一の欠点は Kindle版がないこと（英語版はある）と，和訳が気になる部分が結構あること。２つでした。原著とセットで手に入れると最強の気分を味わえます。鈍器としても使えます。