【解説】全人類必修。ランダム化比較試験 RCT の有用性

この記事では,ランダム化比較試験〈RCT〉が有効な状況とは何か?についてまとめます。そしてなぜいま「RCT の知識」がもはや全人類必修となりつつあるのか?についても解説します。

この記事で「RCT について学ぶことの意義」を感じていただけたら,実際に RCT の解説記事もあわせてご覧いただければ幸甚です。

合わせて読みたい

この記事には案内役としてネコが登場します。この記事では 「RCTとは何か?」その定義や基本的理念・原則 についてまとめます(▼)。RCTが満たすべき基本原則ランダム化されている比較対照(control群)がある明確な評[…]

合わせて読みたい

|この記事では RCT の長所 について解説します。RCT の長所前回の記事で,ランダム化比較試験 RCT の満たすべき条件として,以下の4つを挙げました。ランダム化されている比較対照(control群)がある明確[…]

最初にまとめ:RCTで検証できるものの具体例

  • 医学:抗がん剤Aは,従来の抗がん剤Bと比べて「生存期間を伸ばす」か?
  • 政策:発展途上国の小学校で,抗寄生虫薬の投与は「出席率を上げる」か?
    ┗ ノーベル経済学賞受賞
  • ビジネス:顧客へ送付する広告 A は,広告 B より「収益を高める」か?

RCT とは

ランダム化比較試験(RCT;Randomized controlled trial)は,エビデンスの王様とされています。なぜなら構造的にバイアスを排除する能力が高いからです。

RCT の結果として示されたデータは,下記の様な「誰が見ても誤解のしようがない文章」でまとめられます。

XX がんに罹患している平均年齢 Y 才の人たち Z 人に,A という抗がん剤を B 日投与するという治療をC クール行ったところ,行わなかった群の患者(従来型治療群)に比べて,全生存期間が DD ヶ月延長した

すっきりと事実がまとまっていて,いかにも科学的という印象です。一方,

XX がんに罹患したAさん…
手術も適応外と言われ,絶望していました。
そんな中で友人からZZZ という免疫賦活剤が癌に効く!と聞き,
藁にもすがる思いで試してみたらなんと…
腫瘍のサイズが DD %小さくなっていたんです!!

という一文も見かけることがあるかもしれません。しかしこれらを見比べた時,どちらの方がより信頼がおけそうでしょうか?

2つ目の言説は,以下のような点に問題があります。

  • サンプルサイズが不明で大人数で再現性のある現象なのか不明
  • 何と比較してどの程度良かったか不明
  • 肝心のアウトカムが「腫瘍のサイズ」という「データ」であり,患者さん自身の「生存期間の延長」という本質的なものでない

エビデンスの信頼性とは,こうした本質を「厳密な手続き」で証明できているかどうかに由来します。

RCT で守られる手続き

RCT には守るべき「手順」と「前提条件」があります。

その厳密さが,RCT をエビデンスの王様たらしめる重要なポイントであり,それらを満たしていなければ,RCT とは言えません。

RCTは,実際には下記の手順で進められます(▼)。

一般的な RCT の手順

  1. 「効果」があることを示したい介入【A】,比較対象となる介入【B】を設定
  2. 具体的に示したい「効果」が何か,確実に定義する
  3. 被験者(標本:サンプル)を必要十分な数あつめる
  4. 集めた被験者を,【A】か【B】かにランダムに割り付ける
  5. 一定の追跡期間の後,②の「効果」にどの程度「差」が生じたか確認
  6. その「差」が統計的に有意であるか解析

こうした手続きを経て得られた慎重に集められたデータは,バイアスをよく排除することができるため,エビデンスとしての信頼が高く扱われます。

そのため科学的仮説の〈検証〉,つまり「本当に正しいか(=広く一般化できるか)」確認するには,原則(よくデザインされた)ランダム化比較試験 RCT を施行することが第一とされています。

以下では具体的に,

  1. 医学
  2. 政策決定
  3. ビジネス

といった現場での RCT の実用例を見ていきましょう。

1. 医学における RCT

上記の例で見たように,RCTは医学と極めて相性がよいものです。

実際,RCT という研究手法を最も先に取り入れ,広く普及させたのは医学の世界です。

今の時代,どんな薬剤でもまずはこのRCT で効果を出すことが,薬事承認を受けるための第一条件 となっています。

医薬品はひとたび国家に承認されてしまえば,あとは(本邦の様な皆保険の国では)国民全員のお金から薬代を賄うことになります。つまり間違っても「何の効果もない化学物質」を医薬品として薬事承認するわけにはいかないわけで,厳格な検証手続きへの需要が最も切実な領域なのです。

ひとたび無価値な薬品が上市されてしまえば,大きな経済的損失になってしまうばかりか,不要な薬剤投与によって別の問題(副作用などの有害事象)が増えてしまう可能性もあるからです。

アレルギー反応が強く出て抗アレルギー薬が必要になる場合,など
─ ads ─

医学が「科学」であるために

そのため医学領域では,統計的な考え方,ファクトベースの考え方が非常に重要になります。

「それって本当に意味あんの??」と何度も疑って深く突っ込んでいく考え方が最も普及しているのが医学分野ということは必然と言えるでしょう。

医療者が 『科学的根拠に基づく医療「EBM」Evidence-based Medicine』を心がけようとするとき,まず薬剤上市前に行われている第 III 相試験(RCT) の批判的吟味ができることは最低条件です。

その上で初めて,それぞれの患者さんのケースに当てはめた risk/benefit の検討や,患者さんの価値観とのすり合わせが可能になるからです。

世界中で加速する Ebidence-based XX

試験で統計的に有意な効果があったのか?

という考え方は,医学以外にもあらゆる分野に拡大しています。

実際アメリカやイギリスでは教育現場,政策決定,経済学,ビジネスなどあらゆる場面でこの RCT を施行して「本当に効果があるのか?」と検証を行っています。

そうしたエビデンスにこだわってデータ収集を行い,実際に政府や組織に提言を行う組織・シンクタンクも各分野にあり,合理的な意思決定を下すために大きな役割を担っているのです。

2. 合理的政策決定も RCT

2019年のノーベル経済学賞は

  • Abhijit Vinayak Banerjee(アビジット・バナジー)教授
  • Esther Duflo(エステール・デュフロ)教授
  • Michael Robert Kremer(マイケル・ロバート)教授

の3氏に贈られました。

受賞理由は「世界の貧困削減に対する実験的アプローチへの貢献」です。

2019年ノーベル賞(経済学)は「世界の貧困軽減に向けたフィールド実験」:JICAの教育支援の現場で活用中 |2019年12月4日 国際協力機構

2019 年ノーベル経済学賞

J-PALの活動

上述した前2者(夫婦)は,二人で 2003年に「貧困アクションラボ」通称 J-PAL(ジェイパル)を立ち上げ,その活動が評価されノーベル賞を受賞しています。

その J-PAL のホームページには以下の様に記載されています。

J-PAL is a global research center working to reduce poverty
by ensuring that policy is informed by scientific evidence

要するにJ-PALは,「科学的根拠に基づく政策決定を確実にすることで貧困を減らす」ことを目的に立ち上げられた研究グループだということです。

J-PAL はマサチューセッツ工科大学 MIT 内にあって,多くの開発途上国政府,援助機関と協力し,1000近い RCT を実施してきたといいます。そしてそれらの膨大なデータを掛け合わせて,政策決定へのアドバイスを行ってきました。

J-PAL で最も有名な研究の1つ

J-PALの研究で明らかになった事実の内,有名なものとして

途上国の子供達の学校出席率を上げるコスパのよい施策は「抗寄生虫薬配布」

というものがあります。

ケニアなどの発展途上国では,学校近くに仮設トイレがありません。その辺の遊び場で排便するということはザラにある様で,そうやって遊び場の土が汚染されているため,腸内寄生虫の糞口感染が問題になっていました。

実際,学校の欠席理由の 1/4 が「お腹が痛い」という寄生虫感染関連のものだというデータがあった様です。

そこで,

ランダムにいくつかの小学校を抽出して,「抗寄生虫薬で全員治療する群」を作り出したら,「そうしない群」と比べて出席率が上がるのでは?

──という斬新な切り口で RCT を組んだところ,確かに介入群はコントロール群と比べて出席率が上がったというのです。

1年の介入で,少なくとも 9.3 % 上昇したと報告されています。

Primary School Deworming in Kenya|PovertyActionLab.org
|仮病の除外は?
もちろん「腹痛」はどこの国でも鉄板の“仮病ネタ”と思われるため,その全員が本当にお腹が痛くて休んでいたのか〈真実〉は誰にも分かりません。しかし実際に寄生虫感染率が高い国ですから,本当にお腹の調子が悪くて授業に出られない子供が一定数いることは想像できます。そして実際に一定地域で抗寄生虫薬の効果のデータが得られたことは,有意義なものだと思います。

コスパまで調べて提言する J-PAL

この時点でも興味深いのですが,さらに面白いのが,

「教育を普及させる」という目的のために世界各国で行われた「別の手法」と比較したとき,一番コスパがいいのは何か?

と比較検討している点です。

実際,途上国での教育を拡充させるため他に行われた研究は

  • 「村に学校を作る」という介入@アフガニスタン
  • 「奨学金を充実させる」という介入@ガーナ
  • 「2つ目の制服を配給」という介入@ケニア
  • 「鉄剤・ビタミン剤を投与する」という介入@インド

など数多くあります。

これらはいずれも確かに効果があった介入ですから,当然すべて行っていけばいいのかもしれません。しかし実際の政策決定には,「迅速に効果が得られる」「コストパフォーマンスが良い」といったものが優先されます。

そこで, J-PALは上記の介入で効果を出しただけで満足するのではなく,実際にそれらの介入を全てコスト換算して,「どれが一番コスパの良い介入なのか?」というところまで言及しています。

そして実際に比較してみると…
「児童の出席率を上げる」というアウトカムに対して最もコスパが高かったのは,ケニアの小学校での「抗寄生虫薬の配布」という介入だったそうです。(▼)


▲ J-PAL 記事より抜粋 ── deworming-Kenya 11.91

このデータによって「じゃあまずここから政策として導入していこう」と,次のアクションにつなげることができます。

正直メチャクチャ興味深い研究だと思います。こんな研究を世界各国でたくさん主導し続けていれば……それはもう,ノーベル賞ですわ。それは。

EBPM という考え方

先述の J-PAL の取り組みは主に貧しい地域に対して行われる政策決定ですが,今や英・米をはじめとする西欧諸国でも

エビデンスに基づく政策決定 〈EBPM〉Evidence-based Policy Making

が広がりつつあります。

もはや何を論ずるにも「その仮説は RCT で検証されたのかい?」「検証する予定はあるのかい?」が世界の共通語になってきているのかもしれません。

本邦における EBPM

本邦では残念ながらそうした流れに遅れてしまっていますが,総務省もそうした点に問題意識はある様です。

平成30年10月付の「EBPM に関する有識者との意見交換会報告 (議論の整理と課題等)」において冒頭,以下の様に記載しています(太字は筆者)。

これまでの我が国の政策決定においては,
局所的な事例や体験(エピソード)が重視されてきたきらいがある。過去の「慣行」で行われてきた政策は,本来の政策目標達成のため実効性に欠けるものが多いなどの問題認識が広がる中で,限られた資源を効果的・効率的に利用し,行政への信頼性を高めるために政策を形成していくことは重要であり,このような中でエビデンスに基づく政策立案の推進が必要とされている。

───(中略)───

このようなエビデンスを重視することは英国・米国を始めとして世界的潮流と言えるものである。

───(中略)───

関連して,我が国の政策立案能力が国際的に見て落ちているのではないかという危機感も指摘された。

ようやく本邦でもこうした動きが見られる様になったことは素直に喜ばしいことだと思いますが,英米には既に EBPM に特化した専門機関が機能していることを考えると,日本はまだまだ周回遅れと言わざるを得ません。

一国民として,本邦でも今後広く EBPM とそのデータ開示が普及することを強く願っています。

3. ビジネスも RCT(ABテスト)

少し壮大な話になってしましたが,もっと卑近な例もあります。それがビジネス領域です。

仮説をすぐに検証することができる ランダム化比較試験は,ビジネス領域とも非常に相性がよいことが知られています。

具体例として,プロテインを開発している会社が「顧客に送る広告メッセージ」を考えている場面を想像してみましょう。

A案とB案:本当に効果があるのは?

社内会議で


A「男性向けなのだから,エッチなお姉さんが『マッチョな男性・・・すき///』ってしてる写真を載せた方がいいに決まっているだろう」


B「いやいや!実際に腹筋バキバキになったビフォーアフターの写真を載せた方が興味をそそるんじゃないですか?」

という2つの意見が出たとします。確かにどちらの案も妥当そうです。

では,実際に商品を購入してくれる可能性が高いのは,どちらのメールを送った方が場合なのでしょうか?

誰にも分からない答え

重要な点は「この時点で結論は誰にも分かりようがない」ということです。

実際の現場では,ここでお偉い部長が「うーん,Aだな」と言って決めてしまったり,「多数決(数人単位)の結果,B案に決まりました!」と適当に決めてしまったりするのが常かもしれません。

しかし本当は,もう片方の案の方が効果的だったとしたら? みすみす大きな余剰利益のチャンスを逃してしまうことになります。

これを検証しないのは,非常にもったいないことです。

悩むなら検証すればよい

この様に「複数の案が出たが,誰も本当の最善手が分からない」というシチュエーションこそ,RCTが最も活躍する場面です。

悩むくらいであれば,両者を同じ条件で比較・検証してみて,より効果があった方を採用すれば良いのです。

たとえば最終的に10000人の顧客に送るのであれば,まずは1000人で実験をしてみたら良いでしょう。20 代男性の顧客 1000 人を,ランダムに A案送付グループ,B案送付グループに割り付けます。そして A 案と B 案で「顧客の1ヶ月後の購買率・リピート率」を比較してみます。

結果 B案では購買率が 10 %で,A案では 20 %だったら如何でしょうか。10%の差でも決して侮れません。残りの9000人には全て A 案で送れば,B 案にしていた場合と比べて,一体いかほどの余剰利益を生むことになるでしょうか。

もちろん実際はそのまま 10 倍の効果になるとは限りませんし,偶然の誤差の影響も排除できません。実際には「幅を持って」区間推定をすることになります。ただいずれにしても統計的に有意に A 案が優れているのであれば,A 案を採用すれば OK です。重要なのは,きちんと介入がアウトカムへ寄与しているか,きちんと検証し試行錯誤を続ける姿勢です。

今やビジネス界も RCT が席巻

この様な RCT を,あらゆる広告で試し続ける……それは実際に大手企業がマーケティングの業務としておこなっていることです。

コンビニやスーパーなど大手各社も,

店内で流す BGM は歌ありが良いか,歌なしが良いか

雑誌の配置は窓際が良いか店の奥が良いか

レジのそばに置いておくと購入率が上がる商品は,A か Bか

などなど,簡易的なRCTを繰り返す中で合理化を繰り返して持続的に成長しています。

また,かの有名な Amazon 社も,商品のおすすめの表示パターンなどで RCT を繰り返してシステムを合理化していったと言われています。

ですから商品開発に携わるビジネスマンは勿論のこと,広告や営業に携わるビジネスマンの方々にとっても,RCT を理解することは必須スキルと言えます。

この様なビジネスシーンでおこなわれる ランダム化比較試験〈RCT〉は,ABテストと呼ばれることが多い様です。

誰にとっても RCT

このように,今や世界中の誰にとっても,RCT の知識は欠かせないものとなりつつあります。それはたとえば子育て・家族の健康に悩む世界中のママ達にとってもです。

  • TVで報道されている《健康法》 …
  • ママ友が「いいよ!」と言っていたサプリメント…
  • ネットで紹介されている《教育法》…

こうした怪しげな言説を見抜く防御力を身につけるには,ランダム化比較試験の読み解き方を身につけておくに越したことがありません。

誰かの経験則に投資する価値はあるか?

マーケティングは上記のような言説を巧みに印象付け,わたしたち消費者に擦り寄ります。

そうしたワザに踊らされることなく,「たくさんの人数で証明された,科学的根拠のある健康投資」をおこなう。これは家計にとっても,家族の健康にとっても非常に重要なことです。

適切に予防医学を学び,適切に教育学を学び,本当にエビデンスのあることにだけ投資をすれば,一体いくらの家計のマイナスを防ぐことができるでしょうか。

あらゆる意思決定における合言葉は

それ本当に(良質な)エビデンスあるの?

です。

RCT の理解は情報リテラシーの基本

繰り返しになりますが,RCTはもはやあらゆる現代人にとって必須の教養の1つです

情報化社会で,誰かの食い物にされないために。自らリテラシーを身につけ,悪意ある情報から身を守るために。RCT や,RCT でない研究に,どんな弱点があって,どこまでが「本当に信じることができる内容」なのか?

どこまでが科学的事実で,どこからがただの「意見」なのか?

他の誰でもない,私たち自身が,その「目」を養うしかありません。

数字は嘘をつかないが,嘘つきは数字を使う

「本当に信用性の高い」食事法,健康法,教育法を見極める力は,自分で学び取るしかありません。

まとめ:なぜ今,RCT なのか?

まとめ

「本当に『効果』があるのか?」という問いに対して,RCT での検証は非常に有効です。

RCTで検証できるものの具体例

  • 医学:抗がん剤Aは,従来の抗がん剤Bと比べて「生存期間を伸ばす」か?
  • 政策:発展途上国の小学校で,抗寄生虫薬の投与は「出席率を上げる」か?
    ┗ ノーベル経済学賞受賞
  • ビジネス:顧客へ送付する広告 A は,広告 B より「収益を高める」か?

いずれの検証にも RCT は有効です。

客観的に見て「本当にそうか?」という問いに対して「信用に値するヒント」を与えてくれるのが,ランダム化比較試験 RCT の素晴らしいところです。

いざ RCT の奥深き世界へ…

次頁では実際に,細かく「RCTとは何なのか」,どの様な条件を満たさなければならないのか? みていきたいと思います。

RCTの詳しい解説はコチラ

この記事には案内役としてネコが登場します。この記事では 「RCTとは何か?」その定義や基本的理念・原則 についてまとめます(▼)。RCTが満たすべき基本原則ランダム化されている比較対照(control群)がある明確な評[…]

[おすすめ本紹介]

User’s Guides to the Medical Literature


EBMを学ぶにあたり 1 冊だけ選ぶとしたら間違いなくコレ,という一冊です。著者 Gordon Guyatt 先生は「EBM」という言葉を作った張本人。かなり網羅性が高く分厚い本ですが,気軽に持ち歩ける Kindle 版はオススメです。邦訳版もあります。

医学文献ユーザーズガイド 第3版


表紙が全然違いますが「User’s Guides to the Medical Literature (JAMA)」の邦訳版です。一生言い続けますが,EBMと言えばこの1冊です。唯一の欠点は,Kindle版がないこと(英語版はある)と,和訳が気になる部分が結構あること。2つでした。原著とセットで手に入れると最強の気分を味わえます。鈍器としても使えます。

─ ads ─
>医療統計の解説チャンネル

医療統計の解説チャンネル

スキマ時間で「まるきりゼロから」医療統計の基本事項を解説していく Youtube チャンネルを 2 人で共同運営しています。

CTR IMG