「82%リスク減?」読売新聞で話題のイベルメクチン観察研究

話題の?イベルメクチン論文

去る 2021 年 8 月 5 日,インドで行われた「イベルメクチン予防内服の前向き研究」が Cureus という雑誌上で電子公開(Epub) されました。査読済み論文です。

Behera P, Patro B K, Padhy B M, et al. (August 05, 2021) Prophylactic Role of Ivermectin in Severe Acute Respiratory Syndrome Coronavirus 2 Infection Among Healthcare Workers. |Cureus 13(8): e16897. doi:10.7759/cureus.16897

この論文は読売新聞の記事でも取り上げられており,本邦において一定の注目を得ている様です(▼)。

「今こそイベルメクチンを使え」東京都医師会の尾崎治夫会長が語ったその効能|2021/08/19 10:55 @読売新聞(馬場錬成氏 著)

この記事の中で,この Cureus の論文は以下のように紹介されていました。

つい先日,インドでコロナ感染症の治療ガイドラインを決めている全インド医科大学(All India Institute of Medical Sciences/AIIMS)の研究グループが,イベルメクチンの予防効果を調べた論文を発表しています。
(──中略──)
イベルメクチンを 2 回投与された人は,新型コロナ感染が 83 % 減少したというのです。論文を発表したのは世界でも第一級の研究グループですから,非常に信頼性が高いものです。

(太字,マーカーは筆者注)

その結果,また一部界隈で

イベルメクチンはこんなに「効く」のに何故日本では処方できないのか!

という議論が再燃しているようです。

確かにこうした記事を読んで表面的な情報だけに触れてしまうと,「イベルメクチンが日本で使えないのはおかしい!」と思ってしまう方もいらっしゃるかもしれません。

実際そうした方々と,「これまでの論文はエビデンスとして弱い」という立場をとる専門家との間で議論が紛糾している場面も SNS 上でお見かけしました。

専門家と非専門家の架け橋を

ただ,両者の間にはコミュニケーション不足があるようにも感じられます。

前者はあまり専門家の話を聞いていないような印象があります(結論ありきになっていることが多い印象です)し,後者も「エビデンスとして弱い」とする論拠を十分説明していない傾向を感じます。

特に専門家側からは「話しても理解してもらえない」という諦観も感じられます。

両者は隔絶した世界観で異なる言語を使っているため,制限された文字数の中では会話が成立しない,というのは仕方がないことかもしれません。歩み寄るには知識面での架け橋が必要だと感じます。

というわけで,もしかしたらこの Cureus の論文を吟味し平易に解説するというのも「架け橋」として一定の需要があるのではないかと考えました。そこで自分なりにこの論文の吟味をおこなって,その限界をなるべく端的にまとめてみたいと思います。

この論文が根拠として弱い理由 5つ

最初に結論を述べます。

「イベルメクチンの予防内服が有効である」という根拠としてこの論文が弱い理由は,以下の通りです。

根拠として弱い理由 5 つ
  1. 試験参加者がランダム化されていない
  2. 誰も盲検化されていない
  3. 比較対照がプラセボ(偽薬)でない
  4. 自己申告がない限り PCR 検査されない
  5. 感染爆発時のインドの単一施設という特殊環境

その上で

そもそも「観察研究である」ということの意味と限界

についても述べたいと思います。

どうしても専門用語が含まれてしまう部分はあるかと思いますが,なるべく平易な記載を心がけますので,お付き合いいただければ幸いです。

─ ads ─

この論文の基本的な概要

では早速,この論文の概要をまとめます。

この研究の概要
  • 前向き観察研究
  • インドの単一施設研究(全インド医科大学病院)
  • 施設のスタッフを「予防的にイベルメクチンを飲んでもいいし,飲まなくてもよい」という状態にし,自由に選択してもらった。
  • その後1ヶ月間追跡し,内服した人(曝露群)と内服しなかった人(非曝露群)で COVID-19 罹患のリスクを比較した。
|観察研究?
参加者に「薬を内服させている」という点で一見〈介入研究〉かのようにも見えますが,イベルメクチンを内服するかどうかの選択は自由意志であったため「介入」ではありません。自由意志で飲んだり飲まなかったりした人たちを,ただ 1 ヶ月間「観察」しただけ,という体裁になっています。

PECO-T & 結果

PECO-T でまとめると,この論文の構造は以下の様になります。

  • P:参加者(Participant)
  • E:要因暴露(Exposure)
  • C:比較対照(Control)
  • O: アウトカム/評価項目(Outcome)
  • T:追跡期間(Time)
  • PECOT 概要
    P インドの単一施設(全インド医科大学病院)において COVID-19 の診療に何らかの形で従事するヘルスケアワーカー(3532人)
    E 72 時間あけてイベルメクチン 2 回内服(1回 300μg/kg *2)
    C 特に何もしない
    O COVID-19 罹患(RT-PCRで確定)
    T 2020年 9 月 17 日に参加者組み入れし,同年 9 月 20 〜 30 日を実際の内服期間とした。内服後,1ヶ月間追跡した(同年 10 月 20 日〜 30 日まで)。

    結果の概要

    • 全ての施設従業員 の 90.8 % (3532/3892)が解析対象
    • 3532人のうち,内服を選択したのは 67.5 %(2385 人)

    • COVID-19 罹患(PCR):全体の 5.7 %(201/3532)
      • 内服なし群のうち 11.7 %(133/1147人)が罹患
      • イベルメクチン 1 回内服群 のうち 12.3 %(23/186)が罹患
      • イベルメクチン 2 回内服群のうち 2.0 %(45/2199人)が罹患
    • イベルメクチン1回内服群は,内服なし群と有意差なし
    • イベルメクチン 2 回内服群は,内服なし群に対して有意なリスク減少効果あり。調整リスク比 0.18 倍(95%信頼区間 0.13-0.25, p<0.001

    *調整リスク比は,年齢・性別・職業で補正(log-binomial model)。

    この結果は文字通り解釈可能か?

    上記は一見たしかに「著効している」かのように見えなくもない結果です。

    絶対リスク減少は 9.7 %(2.0 % vs 11.7 %)ですが,相対評価にすると確かに 82 % 減少(リスク比 0.18)!とも表現できます。

    しかし,果たしてこの数字を額面通りに受け取ってよいものでしょうか。もう少ししっかりと情報を吟味してみましょう。

    この論文が根拠として弱い理由 5 つ

    基礎知識の部分の補足も加えながら,この論文が「イベルメクチンの有効性を示す根拠として弱い」と考えられる理由について改めて整理してみます。

    この観察研究がイベルメクチン有効性の根拠として弱い理由 5 つ
    1. 試験参加者がランダム化されていない
    2. 誰も盲検化されていない
    3. 比較対照がプラセボでない
    4. 自己申告がない限り PCR 検査されない
    5. 感染爆発時のインドの単一施設という特殊環境

    順に見ていきましょう。

    1. 参加者がランダム化されていない

    第一の問題点は,研究参加者が「ランダム割付け」されていない,ということです。

    「ランダム化」の重要性

    ランダム化には,あらゆる有利・不利な因子を両群に「トータルで均等」となるように割り振ってくれる強力な作用があります(※十分なサンプルサイズであれば)

    同じ前向き試験といっても,〈ランダム化比較試験 RCT〉が〈前向き観察研究〉から大きく区別される理由はそこにあります。

    観察研究では試験参加者はランダム化されないため,重要な因子について大きな偏りが生じてしまうのが弱点です。

    そのため,後から統計的な処理を行って「データを補正 adjust する」必要があります。年齢などの重大な交絡因子で偏りが生じないよう,数理的な調整が必要になってしまうのです。

    たとえば 治療 A 群に若年の人ばかりが偏り,治療 B 群に高齢者ばかりが偏っている状況で「死亡率」や「重症化率」を直接比較しても,フェアな比較になるわけがありません。仮にそのような比較で A 群の成績がめちゃくちゃ良かったとしても,それは本当に薬の効果なのかわかりません。そこで数理的な「補正」を行う必要が生じます。

    補正には限界がある

    ではあらゆる因子を補正しまくれば〈観察研究〉の結果も〈ランダム化比較試験〉で検討したデータと同等に扱って良いかといえば,そうでもありません。

    この様に「もし他の因子が揃っていたらどの程度変化があるか」を調べる解析を〈多変量解析〉と呼びますが,以下のような限界があります。

    • 補正できる因子の数に限りがある
    • 補正はあくまで数式モデルに基づくバーチャルな推定値に過ぎない

    また,データを補正 adjust するためには,補正対象となる因子のデータを事前に全て収集しておく必要があります。多くの因子で補正をしようとすればするほど,そのようなことは難しくなります。

    結局「未知の交絡因子」や「研究者が思いつかない交絡因子」については全く補正されません。

    結果として,多くの観察研究では年齢・性別・体格・人種・併存疾患などのメジャーな要素のみでの補正が限界になります。

    「補正」でランダム化は代用できない

    ランダム化が特別視されるのは,未知の因子まで含めてあらゆる要素が無作為に割り付けられるからです。

    たとえば年齢は A 群有利になっても,肥満や併存疾患の多さでは B 群が有利になる,といった具合に,未知の交絡因子においても全てが「トータルでトントンになる」ことが期待されます。結果として,両群は「治療が A だったか B だったか」というただ一点をのぞき「比較可能な集団」になり,フェアな検討ができるわけです。

    これこそ〈ランダム化比較試験〉が科学的証明手段の原則とされる所以です。

    |サンプルサイズが小さい場合は別
    ただし,サンプルサイズが小さい場合,ランダム化したにもかかわらず極端な不均衡が生じてしまう確率は大きくなります。そのような不均衡が生じて困らないように,最初から年齢や施設などの重要な因子だけは層別化した上でランダム化をする場合もあります。

    今回の研究では

    今回のインドの研究は〈観察研究〉です。

    研究参加者は「イベルメクチンを飲んでもいいし,飲まなくてもいいよ」という立場です。「飲むか飲まないか」は試験参加者が好きな方を決めているのでした。

    この時点で,両群が均質な集団とならないことは明白です。

    イベルメクチンをあえて飲まない選択をした人たちは,何か理由があるのかもしれません。何らかの既往症がある,薬剤アレルギーや喘息の体質である,すでに体調が悪い,他の治験に参加している,妊婦・授乳婦である,などなど。重大な交絡因子が隠れている可能性があります。

    実際,性別だけみても,その内訳には大きな不均衡があります(男性は 68 % が内服を選択したが,女性は 50 % – 50%)。

    この試験では年齢・性別・職種 の3要素に関しては結果を補正 adjust しているので,それらの不均衡は数学的には織り込み済みです。しかし他の交絡因子に関しては一切織り込まれていません(データ収集自体されていません)。

    そのため,アウトカムの差が「イベルメクチン内服有無」のみによるものとは言えません。計測されていない以上,他の交絡因子の影響がどの程度あるか推し量ることもできません。

    これが〈観察研究〉であることの限界です。

    実際,論文著者らも Discussion で「本当は RCT がやりたかったんだけどね」と述べています(▼)。

    The ideal study design to answer our research question would be a randomized controlled clinical trial. However, due to ethical reasons, we could not choose this design. 「私たちのリサーチクエスチョンに答える理想的な研究デザインはランダム化比較試験 RCT である。しかし倫理的な問題により RCT を選択できなかった」

    |勤務形態も補正なし
    なお本研究で補正されたのは職種(医療スタッフ/行政スタッフ/学生)だけですが,同じ職種であっても部署によって感染リスクは大きく異なるはずです。発熱者が押しかける救急部門や,入院症例の頻回吸痰など密な看護を行うスタッフは,特にリスクが高かったと考えられます。インドの医療事情が日本とどの程度類似しているかわかりませんが,これらの因子で結果が補正されていないのは limitation です。特に今回は「内服あり」を選んだ人と「内服なし」を選んだ人で所属コミュニティや勤務部署自体に偏りがある可能性もあります。どこかの部署や病棟でクラスターが発生した場合,この偏りはさらに大きな交絡因子になります。

    2. 誰も盲検化されていない

    第二の問題点は,誰も盲検化されていない,ということです。

    盲検化とは

    「盲検化」とは治療群なのか対照群なのか分からない状態にする,ということです。試験結果の客観性を高めるため,非常に重要なプロセスです。

    盲検化には段階があり,非盲検,単盲検,2重盲検… 4重盲検となるにつれ客観性が高まり信頼性の高い研究デザインとなります。

    たとえば新薬の承認をかけた大規模 RCT では,患者さんも医療者も「誰が A薬を飲んでいて誰が B 薬を飲んでいるか分からない」という状況で行われる 2重盲検 が求められます。さらに「イベント評価者」や「統計解析の担当者」まで盲検化した4重盲検が,最もバイアスリスクが小さく望ましい研究手法と考えられています。

    逆に,誰も盲検化していない試験(=非盲検試験)では,仮にランダム化比較試験であったとしてもバイアスの入り込む余地が多くあり,信用性を貶める弱点となってしまいます。

    今回の研究では

    今回の研究は〈観察研究〉であり,誰も盲検化されていません。被検者も自らイベルメクチンを内服するかしないか決めており,プラセボ効果の影響はほぼ確実と考えられます(後述)。

    また,解析担当者やイベント評価者(電話聴取の担当者)が〈盲検化〉された記載もありません。そのため恣意的なイベント計上や統計解析が可能だったと考えられます。

    極端な話,「統計的有意差」がいい感じに出るように一部のイベントを除外したりすることも可能であったと言えます。

    |恣意的な解析の疑いあり
    実際,本研究では「1回内服群 + 内服なし群の合算」 vs 「2回内服群」という明らかに恣意的な解析がされている部分があります(=Table 2)。本来のプロトコルである「2回内服」を完遂できず「1回内服のみで終わってしまった」人は,何か副作用などの問題があってやめてしまったのかもしれません。それも含めてイベルメクチンの実力だと言えます。そのため本来は,「内服あり群」と「内服なし群」という構造は維持したまま比較を行うべきで,「1回内服」の人の成績が悪かったからといって「内服なし群」側と合算すべきではありません。

    3. 比較対象がプラセボでない

    第3の問題点は,比較対照(control 群)がプラセボ(偽薬)でない,ということです。

    今回,被験者は自分が「内服群」か「内服していない群」か自ら選択しています。つまり,盲検化はされておらず〈プラセボ効果〉の影響を受けてしまいます。

    プラセボ効果とは,薬理学的効果のないはずの砂糖の塊などを飲んでいても,本人が効くと思って飲んでいれば,何らかのよい効果をもたらしてしまうという現象です(▼)。

    4. 自己申告がない限り PCR 検査されない

    この研究は特に〈プラセボ効果〉の影響を受けやすいデザインになっている点に注意が必要です。

    この研究の主要アウトカムは「COVID-19の確定診断」ですが,その前提とされる RT-PCR 自体が,「自覚症状あり or 患者と濃厚接触をしたと申告された時のみ」に行われているからです。

    非盲検の観察研究で,こうした「自己申告/自覚症状ベース」のアウトカムを設定するのは危険です。

    イベルメクチン群の人が「ちょっとした症状を自覚しても申告しない」可能性があるからです。

    自分はイベルメクチンを飲んでる。この軽い症状、、、、は気のせいだろう!

    と楽観視して報告を怠ってしまえば, PCR 検査を受けること自体ありませんし,COVID-19 の診断がつくこともありません。広義のプラセボ効果と言えます。

    逆に,何らかの理由があって「内服しないことを選択した人々」は,よりナーバスになっていた可能性もあります。結果,軽微な症状を報告したことで PCR によって COVID-19 の診断を受けやすかった可能性を考慮しなければなりません。

    この点は重大なバイアスであり,筆者らも limitation として明記しています。

    5. 単一施設研究にすぎない

    5つ目の問題点は,そもそもこの研究が「インドのある時期の単一施設研究」に過ぎず,日本の現状に一般化できないということです。

    「過度な一般化」に注意

    この研究は 2020 年 9 月〜10月,膨大な感染拡大(第1波)が起きて大混乱となっていたインドの状況下で行われたものです。

    当時のインドの統計を確認すると,毎日 8 〜 9 万人の新規感染があり,毎日 1000-1200 人が死亡していた時期の様です(▼)。

    2020年9月ごろのインドの死亡者統計

    この試験中,この施設(全インド医科大学)でもわずか1ヶ月間に「全参加者のうち 5.7 %」が感染しています。この試験の参加率が全職員の 90.7 % であったことを考えると,大学病院スタッフのほぼ 5 % が わずか1ヶ月間で感染したということになります。

    感染規模や死亡リスクも本邦とは異なりますし,当時はワクチンも開発されていません。さらに当時はインドにとっての「第一波」で情報も乏しく,おそらく医療現場は相当混乱していたのではないでしょうか。

    その様な極端な状況下にあった「インドの単一施設」の研究結果を,現在の日本の外来診療に一般化することは,当然ながら困難です。

    さらに言えば人種も異なり,現在蔓延しているウイルス変異株とは種類も異なります。

    「予防薬」としての研究

    また,この研究は あくまで「予防効果」を評価したものです。「治療効果」を評価したものではありません。この点の混同にも注意が必要です。

    「予防」に関しては,周知のごとくワクチンが既に開発されています。となると,イベルメクチンが「ワクチンと比べて優れているかどうか」「ワクチンに追加して更なる予防効果を期待できるかどうか」が現在となっては気になるところです。

    しかしこの研究からでは,結局そうした疑問は何一つ解決しません。

    また,当時のインドの大学病院スタッフと,現在の日本の市中では感染リスクが大きく異なります。日本の非医療職の一般市民のかたが予防内服する〈益〉は尚更不明です。

    日本の「軽症治療」に関しては何も言えない

    現在日本で主に議論になっているのは

    軽症者の外来治療でイベルメクチンは使えるか?

    という点だと思います。

    軽症の自宅療養者が増える中,その層に対して手軽に使える経口治療薬はまだ出てきていませんから,上記の疑問が生じる背景は理解できます。

    しかし,上記の臨床的疑問に対しては,「自宅療養者でイベルメクチンの効果をみた二重盲検ランダム化比較試験 DBRCT」という研究デザインでしか答えられません。

    今回のインドの観察研究は,いろいろな部分で次元が異なる話を対象としたものであり,残念ながら上記の疑問に対しては何の情報も与えてくれません。

    そもそも観察研究であるという限界

    最後に,根本的な概念の補足をさせていただきます。

    実は,そもそも〈観察研究〉はバイアスリスクが高く信頼性が低い,というのは業界の常識です。今回のインドの研究に特有の問題ではありません。

    1. 試験参加者がランダム化されていない
    2. 誰も盲検化されていない
    3. 比較対照がプラセボでない

    といった問題は,すべての〈観察研究〉に共通した限界点です。

    こうした問題があるため,観察研究で示された「有意差」は「きちんと検証されたもの」として扱われません。あくまで「仮説の探索」や「仮説の提唱」という扱いです。

    合わせて読みたい

    この記事では,医薬品に関するリテラシーとして必須知識である 「仮説検証」と「仮説探索/提唱」の違い について解説します。 「統計的に有意」は等価ではない 医学研究には多くの種類がありますが,ほとんどの研究で最終的に〈統計的に有意[…]

    科学的な「仮説検証」の手順とは

    原則的には,ランダム化比較試験 RCT でしか仮説の「検証」はできない とされています。

    しかもただ RCT であればよいというだけではありません。同じ RCT であっても「後付け解析」や「二次評価項目」は「検証」とはみなされません。

    事前にプロトコルを開示し,十分なサンプルサイズを集めた上で,厳密なプロセスで検定された唯一無二の〈主要アウトカム primary outcome〉だけが,「きちんと検証された仮説」として扱われます(▼)。

    イベルメクチン有効仮説は検証されたか?

    今回読んだ論文も〈観察研究〉ですから,仮説「提唱」的なデザインにすぎません。

    その仮説が正しいかどうかを判断するには,質の高い RCT での「検証」が求められます。

    エビデンスとはそうして積み上げられていくものです。

    現在までの研究

    なお,実際問題イベルメクチンの「有効性」はこれまでどの程度 RCT で「検証」されているのか?というと,実はあまり進んでいないのが現状です。

    単に RCT というだけであればすでに複数の既報がありますが,ほとんどはサンプルサイズが極小(2桁程度)のパイロット試験や,非盲検試験ばかりです。いずれも厳密なプロセスを踏んでいないため「検証的」な試験とは呼べません。

    「検証的」な臨床試験として厳密な手順を踏んで施行された二重盲検 RCT もポツポツと出はじめていますが,いずれもプラセボ(偽薬)に対して有意差を示せていないというのが現実です(▼)。

    軽症治療の二重盲検 RCT
    1. EPIC trial (JAMA) n=398 人
    2. IVERCOR-COVID19 trial(BMC Infectious Diseases) n=501 人
    ※ いずれもプラセボ比較で主要アウトカムは有意差なし。ただしこれは「効かないことが証明された」わけではない。[EPIC trial の解説記事]

    さらに言えば,用法・用量も各研究でバラバラであり,適切な投与量すらコンセンサスを得られていません。

    予防・軽症治療・進行期治療,いずれに関してもイベルメクチンの有効性はまだ仮説「提唱」の段階にあると考えられます。

    |極めて低質なメタ解析に注意
    なお,イベルメクチンに関しては言葉を失うほどにメチャクチャな統計解析をして有効性を喧伝するウェブサイト(ivmmeta.com)が拡散されており危惧しています。そのヤバさについては今年 2 月にかなりの文字数を割いて荒ぶりながら解説しておりますので,宜しければ合わせてご確認ください。あまりにヤバ過ぎて私の言葉も乱れておりますが,ご容赦ください。

    まとめ

    以上です。

    今回の論文が「イベルメクチンの有効性を示す根拠として弱い」と考えられる理由は以下の 5 つです。

    1. 試験参加者がランダム化されていない
    2. 誰も盲検化されていない
    3. 比較対照がプラセボでない
    4. 自己申告がない限り PCR 検査されない
    5. 感染爆発時のインド単一施設の医療スタッフという特殊環境

    さらに根本的な話として,

    そもそも〈観察研究〉という時点で「検証的」でない

    ということも補足いたしました。

    上記は日頃医学論文を読む人にとってはごく基本的な内容ですが,習慣のない方には小難しく感じられたかもしれません。

    そうした背景知識の違いに起因する「専門家」と「非医療職」のコミュニケーション不足が,誤った情報拡散を助長してしまっている様に感じます。

    この記事を通し,多少なりとも論文解釈の流れや基本的な知識を共有できたとしたら幸いです。

    なおこの記事は私の解釈に過ぎないことを改めて強調させていただきます。可能であれば,必ず原著もご確認ください。また何か間違いがあればご教示ください。
    次回予告

    次の記事では引き続いて,イベルメクチンについて現在分かっているエビデンスをまとめたいと思います。

    その上で,なぜ専門家はこれほどイベルメクチンの使用に慎重なのか?という点についても,解説していきたいと思います。

    おまけ
    • この記事には次ページがあります(下にリンクあり)
    • オマケとして,箇条書きでこの論文をもう少し深く掘り下げています
    • 専門用語が多くなってしまっていますが,関心のある方はご覧いただけたら嬉しいです

    [おすすめ本紹介]

    Users’ Guides to the Medical Literature


    タイトル通り「医学論文を現場でどう応用するか?」迷える臨床家のためのユーザーズガイド。Tips 集のような構成で,どこからでもつまみ読みできます(通読向きではない)。医学論文の批判的吟味を学ぶにあたり 1 冊だけ選ぶならコレ,という極めて網羅性の高い一冊です。著者 Gordon Guyatt 氏は “EBM” という言葉を作った張本人。分厚い本ですが,気軽に持ち歩ける Kindle 版はオススメです。邦訳版もあります。

    医学文献ユーザーズガイド 第3版


    表紙が全然違いますが「Users’ Guides to the Medical Literature (JAMA)」の邦訳版。医学文献を批判的吟味するためのTips集としてかなりの網羅性を誇る代表的な一冊です。唯一の欠点は Kindle版がないこと(英語版はある)と,和訳が気になる部分が結構あること。2つでした。原著とセットで手に入れると最強の気分を味わえます。鈍器としても使えます

    ─ ads ─
    >医療統計の解説チャンネル

    医療統計の解説チャンネル

    スキマ時間で「まるきりゼロから」医療統計の基本事項を解説していく Youtube チャンネルを 2 人で共同運営しています。

    CTR IMG