【解説】ランダム化比較試験 RCT の特長

|この記事では RCT の長所 について解説します。

RCT の長所

前回の記事で,ランダム化比較試験 RCT の満たすべき条件として,以下の4つを挙げました。

  1. ランダム化されている
  2. 比較対照(control群)がある
  3. 明確な評価項目(エンドポイント)がある
  4. (可能な限り多重の)盲検化が望ましい

このような条件を満たした RCT がエビデンスの王様と位置づけされる(▼)のには理由があります。



それは,RCTというものが構造的に

  1. 「バイアスのリスクが低い」
  2. 「交絡因子の影響を受けにくい」

ためです。

今回はこれらの長所についてまとめてみます。

長所①:バイアスのリスクが低い

そもそもバイアスとは?

バイアスとは,日本語では「偏り」といわれるものです。

厳密には,単に偏っているというという意味ではなく,「一定の方向性」を持って〈系統的にズレ、、ている〉,という意味です。

生体などを対象にした実験を行うと,確率的ランダムに結果がバラつくことはよくありますが,そのようばバラツキは〈偶然誤差ランダムエラー〉と呼び,〈系統的誤差バイアス〉とは区別されます(▼)。

ランダムエラーとバイアスの模式図

▲ 偶然誤差(=ブレ)のみの場合と,バイアス(=ズレ)もある場合の模式図

確率的・不確定なものを対象にしている以上,偶然誤差(ランダムエラー)は避け得ませんが,バイアスはなるべく構造的に排除する必要があります。

科学において何よりも重要なのは,客観的であることです。

研究者やスポンサー,メーカーは「効果」を示したいと考えているため,どうしてもそういう方向性に結果は歪められます。

彼らが示そうとしている「効果」に対し,意図的にプラスの影響を与える様なバイアスが入り込む余地を,いかに排除できているか?

「エビデンス=科学的根拠」を適切に読んで適応するには,そういう「バイアスリスク」の吟味が非常に重要となります。

─ ads ─

バイアスはいつ生じるか?

ここで,

バイアスは 試験中のあらゆるプロセスで生じる可能性がある

ということが重要です。

「あらゆるプロセス」とはつまり,

  • 「試験対象者の選択」
  • 「割り付け」
  • 「データの収集」
  • 「データの分析」
  • 「報告」

全てのタイミングです。

しかし RCT は少なくとも「割り付け」に関しては完全にランダムなので,非ランダム化比較試験 NRCTよりもバイアスのリスクが低く,信用性が高くなるというわけです。

割り付け以外のバイアスには個別の対処が必要

ただし,「割り付け」以外のプロセスで生じるバイアスは,ただ RCT というだけでは排除できません

それぞれ個別の対処が必要です。

そうした対処法がきちんと行われているのか?という点も『RCT の質』を判断する上で重要となります。

※また少し混み入った話になりますので,個別に別項で扱いたいと思います。

合わせて読みたい

職場の論文抄読会で,臨床試験論文の「批判的吟味」をしたい!でもどういう風に論文を読めば「ヤバいところ」を見抜けるかわからない!!実はあと1時間後に抄読会始まるけどまだ本腰入れて読んでない・・そんな時,臨床試験の質を『爆[…]

|他のプロセスで生じるバイアスへの対処例
  • 中央割り付け方式による隠蔽化 ──「割り付け」時に恣意的選択を排除
  • 多重盲検化 ── データ報告時に主観や希望が入り込む余地を排除
  • IPCW 法 ──「データ収集」時に起きる「欠測」が結果に与える影響を考慮
  • ITT解析 ──「分析」の際,群間移動などによるバイアスを除外

前向き試験である強み

またランダム化比較試験 RCT は〈前向き試験〉です。

そのため〈後付け解析〉post-hoc analysis を行わない限りは,あらかじめ提出されていたプロトコルと違う「都合のよい統計解析」を行う余地が少ない,というのもポイントです。

これにより〈後ろ向き研究〉と比べてかなりバイアスが入り込む余地が小さくなっています。

〈後ろ向き研究〉ではいくらでも結果の解釈を都合よく変えることができるため,どうしてもバイアスリスクは高くなってしまいます。後ろ向き解析の結果で「有意差あり」という結果になっていても,鵜呑みにはできません。そのウラで一体何度の多重比較
・多重検定が行われた上でひねり出された「有意差」か分からないからです。

長所②:交絡因子の影響を受けにくい

RCT の 2つめの長所は「交絡因子の影響を受けにくい」ということです。

交絡因子とは「調べたい要因以外に関与する因子」のことです。

運動習慣 と 健康意識 と 脳卒中

たとえば「運動習慣」と「脳卒中の発症率」の関係を調べる時のことを想定してみましょう。

「健康診断時に記載してもらったアンケート結果」など疫学的なビッグデータから,この二つの関係性を解析してみます。

こうした研究は〈観察研究〉と呼ばれます。一方,実際に被験者に対して○○してもらって結果を確認する,というのが〈介入研究〉です。RCTは〈介入研究〉の代表格と言えます。

この観察研究では,実際に「運動習慣がある人」の方が,生涯の「脳卒中の発症率が低い」傾向にありました。

さて,ここでこのデータの解釈が問題になります。

これは

「運動習慣があった :A」から「脳卒中になりにくかった :B」

のでしょうか?

それとも

「運動習慣がある人 :A」は
「健康志向が高いため,喫煙をしない傾向にあった :C」から
「脳卒中になりにくかった :B」

のでしょうか?

因果関係と相関関係

前者の解釈では,「 A ➡︎ B は真の “因果関係”」と言えます。

しかし現実には後者だとすると,「A ➡︎ B に “相関関係” はあるが,真の “因果関係”には C が大きく影響している」ということになります。

つまり本当のところの A と B の因果関係は不明です。

この例における喫煙習慣(C要素)の様に「隠れた因果関係の要素」のことを,一般に〈交絡因子〉と呼びます。

観察研究でも〈既知の交絡因子〉は調整できる

今回の様に「喫煙しているかどうか」など予め想定されやすい〈交絡因子〉に関しては,最初からデータを収集しておけば,大きな問題はありません。

あとから「同じくらい喫煙する人同士で,運動習慣が有るか無いかでリスクが変わるか比較」といった解析をすることはできるからです。

” C 要素を揃えた” 縛りの上で「運動習慣 :A」と「脳卒中の発症: B」の関連性を調べる ── といったことは,統計ソフトを使えば,さして労せずに可能です。

層別化解析や,Propensity score match 法などがあります。

観察研究では〈未知の交絡〉を調整できない

しかし実際には 想像できていない〈未知の交絡因子〉 D,E,F,,, がある可能性は,常に否定できません。

そして,そうした全ての〈交絡因子〉を予め想定した上でデータを集めておいて,あとで調整する,などということは現実には不可能です。

結局のところ〈観察研究〉ではこの〈未知の交絡〉を調整することができないために,「本当に直接的な“因果関係“があるのか?」は常に不透明なのです。

観察研究では〈相関関係〉 は示せるが〈因果関係〉は示せない

ということです。

RCT なら “トータルで” 均等に割り振れる

しかしサンプルサイズが十分に大きい RCT であれば,こうした隠れた交絡因子 C,D,E,F,,, すらも両群均等に割り振ってくれます。

両群が「トータルではバランスが取れている」という状態にしてくれるのです。

そのため〈観察研究〉と比べて格段に交絡因子の影響を受けにくく,エビデンスとしての信用性が高くなるわけです。

【補足】トータルで均等とは?
  • 一例として,ある新規の降圧薬 A と,従来型の降圧薬 B の効果を比較した RCT を考えてみます。この試験の主要評価項目は「心血管イベント(心筋梗塞・脳梗塞・心血管死亡の複合)」であったとします。
  • このとき,ベースラインの年齢や血圧,過去の心血管イベントの既往症の有無などが,A 群と B 群で大きく違っていたら解釈に困ることになります。
  • その場合,アウトカムに差があったとしても,その差は本当に「薬の効果による差」なのかわかりません。もともとのベースラインの差が検出されてしまっているだけの可能性があります。
  • しかしサンプルサイズが十分に大きい RCT であれば,「年齢では A 群が不利」でも,「ベースの血圧では B 群が有利」,というようにトータルでのバランスは保たれることになります。
  • これにより〈未知の交絡〉すらも含めた上で「総体として均等な 2 群にしてくれる」という威力があるのです。
ただしサンプルサイズが小さい RCT はこの限りではありません。重要な背景因子で群間不均衡が出てしまうこともあります。そうした重大な背景因子をなんとしても「均等」に割り振りたい場合は,特別の工夫を行う場合もあります(層別化ランダム割り付けなど)。
|補足
論文を読んでいる時に「えっ?この背景因子だけは絶対に揃ってないとマズいのでは…?」という limitaion に気付けるかどうかは,論文読者のリテラシーが問われる部分だと思います。専門外の分野の論文だとなかなか気づきにくい場合もあり,むずかしい問題です。

RCT だけが仮説を〈検証〉できる

ここまでみてきたように, RCT は構造的にバイアスを排除する力が強いため,エビデンスの王様とされています。

そして何よりも重要なことは,統計的に適切な手法で仮説の〈検証〉ができるのは RCT だけである,ということです。

RCT が唯一〈因果関係〉を直接的に〈検証〉できる手法

なのです。

仮説検証と仮説提唱

先述したように〈後ろ向き研究〉はどれもバイアスリスクが極めて高いため,〈仮説提唱、、〉はできても〈仮説検証、、〉はできません。

また〈前向き研究〉であったとしても,〈観察研究〉では,交絡因子を除外できず〈因果関係〉の直接的証明はできません。〈相関関係〉を示すのみです。

〈前向き研究〉かつ〈介入研究〉である RCT だけが,仮説を〈検証〉することができます。

とくに,適切な対照群を用意した二重盲検以上の RCT は,仮説の〈検証〉ないし〈立証〉に関して最も有効な手段です(▼)。

創薬は RCT

だからこそ,創薬の最終段階といわれる第 III 相試験では,プラセボ比較の二重盲検 RCT で有意差を示すことが「薬事承認」のための大切な要件とされています(▼)。

phase I 〜 III

RCT の長所まとめ

以上です!

一言でまとめると,バイアスと交絡因子を排除する力が強いのが RCT の特長だと言えます。

この 2 つのポイントのために, RCT は唯一〈仮説検証〉に使える研究手法とされています。

RCTの限界は?

本項では RCT の特長を主に取り上げて参りましたが,RCT も残念ながら万能な研究手法ではありません。

以下に示すような問題点があり,結果の〈解釈〉をするときには相応の注意を要します。

RCT にゼッタイついて回る 5 つの限界

  1. 莫大なコストがかかる
  2. 資金源バイアス・実験効果により結果が誇張されやすい
  3. サンプルサイズの影響が大きい
  4. 希少なものは相手にできない
  5. ただ1つの仮説しか〈検証〉できない

次の記事では,これらについてまとめてみたいと思います。

次の記事

前回の記事では,RCTの特長についてまとめました(▼)。バイアスを排除する力が強い交絡因子を排除する力が強い前向き研究であり直接〈因果関係〉を〈検証〉できる[sitecard subtitle=前回の記事 url=/stat[…]

[おすすめ本紹介]

ファクトフルネス FACTFULNESS


ビル・ゲイツが希望者全員に配布したことで有名な世界的超ベストセラー。スウェーデン医師・国際保健学教授である筆者が,誰もが勘違いしている「世界の事実」を1つ1つ挙げながら,本質を歪めて見てしまう人間の本能・バイアスを列挙していきます。脳髄に金槌で釘を打ち込まれるくらいの衝撃を何度も与えてくれる名著です。やや分厚い本ですが,Audible なら通勤時間で聞けてしまうので,大変オススメです。

─ ads ─
>医療統計の解説チャンネル

医療統計の解説チャンネル

スキマ時間で「まるきりゼロから」医療統計の基本事項を解説していく Youtube チャンネルを 2 人で共同運営しています。

CTR IMG