【新型コロナ】リスク保因者に対するイベルメクチン投与は有用か?【I-TECH試験】

COVID-19 治療薬の候補として,イベルメクチンはしばしば話題になります。

これは,高濃度のイベルメクチンがSARS-Cov-2 に対する抗ウイルス活性もつことが示されたことに端を発しています(試験管実験)。

しかし人体で安全にそのような濃度を達成することは容易ではなく,用法・用量の適正も議論不十分です。そのため投与量や投与期間も,各臨床試験で幅があります。

実際に重症化予防効果を発揮するのか?といった点も不透明です。妥当性の高いデザインの臨床試験(いわゆる検証的試験)は未だ少なく,またいずれも偽薬プラセボや通常治療に対する優越性を統計的有意に示せてはいません。

ただし,これは「効かない」ということが直接立証されたという意味ではありません。「効かないことが真実だとしても起きうるデータしか得られていない」ということです。この2つは似て非なるものです(後述)。

一方,小規模研究や後方視研究からは効果が期待される側面もあります。これらの研究(探索的研究)はバイアスリスクが高く結果の信頼性が低いものですが,一部の医療者等はその有効性を強く主張しています。

当ブログでも,そうしたグループがしばしば引用する偏ったメタ解析の問題をご紹介したり,小規模臨床試験の問題を取り上げてきました。読売新聞が「非常に信頼性が高い」研究としてインドの単一施設の後方視研究を報道をしたこともあり,その論文の読み方を取り上げたこともありました。

最近はニュースで取り上げられることも少なくなっていましたが,2022 年 2 月に 500人規模のランダム化比較試験 RCT(非盲検)の結果がメジャーな医学雑誌に公開され,また一部界隈で物議を醸したようです(▼)。

Efficacy of Ivermectin Treatment on Disease Progression Among Adults With Mild to Moderate COVID-19 and Comorbidities: The I-TECH Randomized Clinical Trial
PMID: 35179551 JAMA Intern Med. 2022 Feb 18.

私も上記文献をナナメ読みしたので,簡潔に所感をまとめてみたいと思います。

試験概要

デザインの概要

  • マレーシアで行われた非盲検 RCT(n=490)
  • 重症化リスクの併存疾患を持つ 50 歳以上の入院患者が対象(平均63歳)
  • 発症 7日目以内の PCR 確定例であることが参加要件(平均 5 日)
  • イベルメクチンあり vs 通常治療群で比較
  • 主要アウトカムは「酸素が必要になるまで悪化する人の割合」(※)
※「WHO scale 5-9(酸素を吸う以上〜死亡未満)」
  • 要するに,重症化しそうだけどまだ酸素投与は不要な人を「入院経過観察」とした上で,イベルメクチンを追加するか通常治療のみかでランダム割り付けし経過を追った試験です。
  • 発症して平均 5 日とそれなりに時間経過したケース,かつ入院症例を対象としています。そのため軽症外来患者を対象とした試験(EPICなど)とは参加者の背景因子が大きく異なります。
  • なおワクチン2回接種者は両群とも約5割,未接種者は両群とも約3割で群間不均衡なし。入院時点の WHO scale(重症度)もほぼ同等です。

結果

イベルメクチン vs 通常治療

  • 主要アウトカム〔酸素必要まで悪化の割合〕:統計学的有意差なし
    52 人 vs 43人 (21.6 % vs 17.3 %) RR1.25 [95%信頼区間 0.87-1.80]
  • 副次アウトカム〔挿管人工呼吸割合〕は 4人 vs 10人(2.5% vs 3.2%)
  • 院内死亡は 3 人 vs 10 人(1.2% vs 4%)

結果は,いずれも統計的に有意ではありませんでした。

しかし,実数のみに着目すると,主要アウトカム(重症化する人の割合)と副次アウトカム(中でも特に挿管や死亡に至る人の割合)でなぜか逆転現象が起きています。

この点がまた少し物議を醸した様です。

たとえば

主要アウトカムを「WHO scale 6-10(*)」にしていたら違う結果になっていたのではないか

(*)ネーザルハイフローや挿管以上の酸素需要〜死亡まで含む

重症化したときの死亡だけ見れば,イベルメクチンはやっぱり「効く」薬なのではないか

といった主張をする人が現れたわけです。

その様な解釈は一般的な臨床試験の結果の見方として問題があるのですが,この論点に関し以下の順で私見をまとめてみます。

  1. 「統計学的に有意でない」という意味
  2. 「重症化は防がないのに死亡は防ぐ」原因の合理的な説明は
  3. その他の治療は揃っていたか

「統計的に有意ではない」の意味

まず最も端的な問題となるのが,そもそもこれらは全て「統計的に有意な差」ではない,という点です。

言い換えれば,今回の結果はすべて「標本のランダム性」のみで説明できる範疇のバラツキとみなされます(▼詳細)。

─ ads ─

主要アウトカム

まずは主要アウトカムの「酸素を必要とする状態に悪化した人の割合」に着目します。その結果は,イベルメクチン群52 人 vs コントロール群43人 (21.6 % vs 17.3 %)でした。

つまり今回の標本ではむしろイベルメクチンの方が悪い結果だったのですが,これは〈統計的に有意な差〉ではなかったのでした。

そのため,今回の結果を母集団(=全ての想定患者さん)に一般化して

イベルメクチンは入れないほうがいい!

と言えるような根拠にはなりません。

今回のデータは,たまたま得られた標本に限られたデータに過ぎません。全く同じデザインでもう一度別の 500 人を集めて RCT を行い直したら逆の結果になる可能性が十分あります。それが〈統計的に有意ではない〉という言葉の意味です。標本データは母集団から「確率的にブレる」ものなので,今回の結果はそのブレ、、の範囲を逸脱しないものだということです。

そのため本研究からはイベルメクチンを入れた方が「良い」とも「悪い」とも断ずることはできません。 

ただ,この規模の非盲検試験(原則的には実薬群側が有利;後述)で結果を出せていないとなると,臨床家が抱く印象が厳しくなるのは当然です。

少なくともこの患者層(リスク因子を有する発症5日目以降の中高年)にとって「特効薬」などでは全くないだろう

と考えるのが一般的と思われます。

標本・母集団などについての解説動画はコチラ
|※本当によくある誤解
大変誤解されやすいのですが,「有意差なし」となった今回の治験結果はイベルメクチンが「効かない」ことを示したわけではありません。統計学的仮説検定は帰無仮説が棄却できるかできないかを問うだけだからです。今回の治験で設定された〈帰無仮説〉は「イベルメクチンを入れても入れなくても効果に差はない」というものです。そして今回の結果は,この〈帰無仮説〉が正しくても十分おこりうる範囲のデータしか得られませんでした。つまり〈帰無仮説〉を棄却できませんでした。ここから導き出される結論は,「効果に差がない」という仮説を否定できない、、、、、、,ということです。「イベルメクチンは効かない」と立証したわけではありません。「差がない」ことを統計的に証明するためには,もう少し複雑な試験デザインが必要になります。医療系の報道でもこのあたりの言葉の使用に注意が払われていないことが多いと感じますが,注意すべきポイントです。

二次アウトカム

二次アウトカムについても同様のことが言えます。

イベルメクチン群 vs コントロール群

  • 挿管・人工呼吸:4人 vs 10人(2.5% vs 3.2%)p=0.17
  • 院内死亡:3 vs 10(1.2% vs 4%) p=0.09

結果は上記のように,若干コントロール群の方が悪かったのでした(=主要アウトカムと逆転)。

しかし,これも主要アウトカム同様に〈統計的に有意〉ではありませんでした。つまり,標本のランダム性のみによって十分説明できるデータです。

多重検定の問題

また,

死亡は p=0.09 だから,ギリギリ有意差がつかなかっただけ!惜しかった

といった解釈も大きな誤りです。

現実には,もし仮にこれらが一見「有意」の様に見える結果になっていた(p<0.05になっていた)としても,「統計学的に有意」とはみなせません。

主要アウトカムでないものを後付けで「メインの解析結果」のように扱う(=検証的に扱う)ことはできないからです。

きちんと検証、、するためには改めて「死亡を主要アウトカムに据えた上で,十分なサンプルサイズを集めて試験を行う」必要があります。あるいは,有意水準を 0.05 ではなくより厳しいものに設定し直す必要があります。

そうした対応を取らない場合,意味もなく偶然 p値が低いデータが得られる可能性が累積的に高くなってしまうからです。「後付け」やサブ解析,二次評価項目での有意差は,基本的にαエラーである可能性が高く,一般化できません。

二次アウトカムはあくまで仮説探索的なものであって,検証・立証には使えないものなのです。

この問題を多重検定の問題と呼びます。ご存知ない方は,動画で簡潔に説明していますのでぜひご覧いただければ幸いです。多重検定の問題)。

ということで,これ以上の考察はある意味不要かもしれません。

結局今回の結果は

ランダムなバラツキで説明できる範囲でした

というだけだからです。しかしそれだけで終わってしまうのも味気ないので,もう少し掘り下げて考えてみたいと思います。

次に考えたいのは,機序の問題です。

「 重症化は防がず死亡は防ぐ」という薬理効果?

統計的に有意かどうか,という点は一旦傍においたとしても,

「酸素投与を必要とする人」を減らさず「挿管」「死亡」だけは減らす

などという「効き方」が合理的に考えてありうるのか? というのも無視できないポイントだと思います。

イベルメクチンに COVID-19 肺炎の重症化予防効果があるのなら,

  1. 「酸素投与を要する重症化」をまず減らすことによって
  2. 「挿管を要する重症化」を減らし
  3. 「死亡」も減らす

という順になるはずです。これらの悪化イベントは通常,包含関係にあるためです。

「酸素投与必要者」を減らさず「挿管」や「死亡」だけを減らす,ということがあるとすれば,それはもはや抗ウイルス作用の発揮、、、、、、、、、、という機序で説明できるものとは考えられません。

そのような通常では起き得ない逆転が起きている,ということは,イベルメクチン単体の効果ではなく「なんらか別要因」による影響を考えるのがより自然ではないかと思います。

|デキサメタゾンは別
デキサメタゾン(※ステロイド)全身投与のように「抗炎症作用」が効果の主体となるケースでは,むしろ軽症例ではなく進行例に投与しなければ悪化させてしまうリスクがあることは知られています。そのような作用機序であれば「酸素が必要な人」を減らさず「挿管」や「死亡」だけを減らすといったことも(対象者と投与タイミングによっては)あるかもしれません。しかしイベルメクチンは抗ウイルス活性を期待されているわけで,発症早期の軽症段階からの投与を行い重症化を防ぐ→それによって挿管や死亡例が減る,というストーリーが妥当と思われます。実際この試験もそのような形を期待したからこそ,主要アウトカムに据えられたのは「酸素投与を要する重症化」なのでした。

その他の治療は揃っていたか

ではその「別要因」とは何が考えられるでしょうか。

被験者の特性を比較した Table 1 を見てみると,いくつか群間不均衡が気になる点はあります(▼)。

イベルメクチン群 vs 通常治療群

  • 治験参加前に「抗菌薬治療を受けた」人の割合(7.9 % vs 2.8 %
  • 治験参加前に「抗凝固薬治療を受けた」人の割合(7.5% vs 3.6%

これらの不均衡はランダム化によって偶然生じたものなのかもしれませんが,気になるところです。均等な集団の比較と言えるかどうかは検討が必要です。

また本試験は非盲検試験ですから,医師も看護師も患者さん本人も,現場の全員が「イベルメクチンを飲んでいるのは誰か」わかっている状態です。これによって,たとえば医者が薬剤介入をするときの意思決定に影響が出てしまった可能性は否定できません。

他にも,慢性腎不全(CKD)の割合も,イベルメクチン群 11.6% vs 通常治療群 17.3%と結構な不均衡になっています。

こうした不均衡が背景にあったことで「ひとたび悪化したら一気にいくとこまで行ってしまう人」がコントロール群に偏ってしまっていた可能性もあるかもしれません。

|入院後の治療介入
入院後の治療介入を見ても,抗凝固薬の使用に結構な差があります(イベルメクチン群の29%に対してコントロール群は 23 %)。ただこの点に関しては,単純に酸素を吸うレベルまで悪化した人はイベルメクチン群に多かった(21.6% vs 17.3 %)──そしてこの人たちはヘパリンを投与されやすい──ので,単純に主要アウトカムの差を反映した部分が一定程度ありそうです。とはいえ,非盲検試験ですから,現場の医師らの臨床判断にイベルメクチン内服が与えた影響は必ずあるはずです。そのため今回の試験は,解釈が難しくなってしまいます。

open-label という大きな limitation

いずれにしても,open-label(非盲検試験)という試験デザイン上の問題が,結果の解釈に大きな縛りをかけます。

非盲検ということは,現場の医師も看護師も割り付けを知っています。そして何より患者さん自身が「自分は実薬群なのかどうか」を把握しているということです。この事実は1つ1つの小さな意思決定にも必ず影響を与えてしまいます。

一般的には,非盲検試験は実薬有利(プラセボ効果・ホーソン効果)となることが知られています(▼)。

その下駄を履いた上でも500人規模で差を示せなかったということは,少なくともイベルメクチンがこの患者層(リスク因子を有する発症5日目以降の中高年)にとって「特効薬」でないことは確かそうです。

どうせなら二重盲検 RCT でしっかりと検証してほしかったところですが,やはりコストの問題でしょうか。手順が煩雑となり患者さんのリクルートが遅れれば治験自体が立ち行かなくなるので,スピードを重視したのかもしれません。

有害事象

いっぽう,有害事象はイベルメクチン群で目立って認めました。

イベルメクチン群 vs 通常治療群

  • 何らか1つ以上の有害事象(トータル):13.7 % vs 4.4 %
  • 下痢:5.8 % vs 1.6 %

これはプラセボ効果の逆(=ノセボ効果)の部分もある(*)でしょうが,もともとイベルメクチンは消化器症状をきたすことが知られているので,この程度の頻度であれば想定範囲かもしれません。

本試験では主要アウトカムで有意差がついていないため,この有害事象のリスクに見合うベネフィットは期待できない,と考えるのが妥当です。

(*)本試験では患者さんも医者も誰がイベルメクチンを飲んでいるかわかっているため,軽微な体調不良を「治験薬の副作用」と考えやすくなります。このためごく軽微な消化管症状の不調なども有害事象として指摘されやすく,カウントされやすかった可能性があります。

まとめ

以上です。要するに今回の試験では

イベルメクチンが「統計的に有意な重症予防効果」を示せなかった

というだけなのですが,副次アウトカムばかりに着目するなど問題のある解釈を時に見かけましたので,取り上げてみました。

某所

某所(ivmmeta.com)はさすが仕事が早く,このネガティブ試験の死亡アウトカムだけを取り出して "positive result" の RCT として計上しています(▼)。

ivmmeta.com より抜粋(2022年2月現在)
ivmmeta comはいつもぶれない

※ 今回の論文は late treatment の1つの RCT としてカウントされています。
上表の All studies の5列目には「効果がない治療をもとに,80 の研究のうち 70 個で “positive results” が示される可能性は 6330億分の1」と記載されています。頭が痛くなる記載です……

Negative study(=有意差の出なかった研究)から都合のよい後付けアウトカムの点推定値だけを抜き出し「positive study 扱い」にする必殺技,1年前からずっとブレていません。

清々しいといいますか,同じ数字を見ていながらここまで別の偏った解釈になるのかと,なんとも哲学めいたことを考えてしまいますね…

日本の臨床試験は現在も進行中

ひとまず現時点で私が臨床家としてイベルメクチンを処方することはありませんが,正直効いてくれるならありがたいのにとは思っています。薬の選択肢は多い方がいいですし,安いですし,何より現場としては目の前の患者さんが回復してくれることが第一です。

ただ残念ながら,今のところ「これは処方すべきだ」と思えるような検証的試験のデータが乏しいのが実情です。

日本の試験のデータも非常に気になっているので,公表されたらぜひ目を通したいと思います。

当ブログでは過去にモルヌピラビルの臨床試験データの批判的吟味も行っていますので,ご興味のある方はあわせてご覧いただければ幸甚です。
合わせて読みたい

以下の内容は 2021.11.30 時点の公開データ(FDA審議資料)を元に作成していますモルヌピラビル(molnpiravir; MOV)は,COVID-19 に対する世界初の経口内服治療薬として期待されている新薬です。1[…]

[おすすめ本紹介]

User’s Guides to the Medical Literature


EBMを学ぶにあたり 1 冊だけ選ぶとしたら間違いなくコレ,という一冊です。著者 Gordon Guyatt 先生は「EBM」という言葉を作った張本人。かなり網羅性が高く分厚い本ですが,気軽に持ち歩ける Kindle 版はオススメです。邦訳版もあります。

医学文献ユーザーズガイド 第3版


表紙が全然違いますが「User’s Guides to the Medical Literature (JAMA)」の邦訳版です。一生言い続けますが,EBMと言えばこの1冊です。唯一の欠点は,Kindle版がないこと(英語版はある)と,和訳が気になる部分が結構あること。2つでした。原著とセットで手に入れると最強の気分を味わえます。鈍器としても使えます。

─ ads ─
>医療統計の解説チャンネル

医療統計の解説チャンネル

スキマ時間で「まるきりゼロから」医療統計の基本事項を解説していく Youtube チャンネルを 2 人で共同運営しています。

CTR IMG