【新型コロナ】イベルメクチン vs 軽症例｜EPIC trial 〜概要まとめ編〜

2021年3月13日
2021年3月15日
医学・医療
RCT 抄読会

今回，発表直後から大変な物議をかもし，陰謀論と宗教論争まで勃発させたあの、、『いわくつき論文』 を吟味しました。

Effect of Ivermectin on Time to Resolution of Symptoms Among Adults With Mild COVID-19: A Randomized Clinical Trial ── JAMA. 2021 Mar 4.

JAMA2021-Epic

色々考えさせられる興味深い論文でしたので，2 部に分けて詳細に掘り下げてみたいと思います。

まず本項ではこの試験の概要を押さえた上で，ポイントをまとめます。特に「Powerとは何か？」という観点でよく考えてみたいと思います。

また，本項の最後では，この論文の社会的インパクトと，一部の過剰反応に対して，個人的な意見を述べます。

1 EPIC trial の概要
- 1.1 デザイン
- 1.2 PICO-T
2 結果・結論
3 この試験のポイント（私見）
4 社会的インパクト
5 総括

EPIC trial の概要

3行まとめ

軽症かつ低リスク群（若年＋大きな併存症なし） COVID-19 症例 400人
イベルメクチン5日内服は，プラセボと比べ「症状消失までの時間」を短縮する有意差を示せず
その他の患者層での有効性やリスクは今回の試験では不明

私見：テクニカル面など色々と問題はある論文でしたが，イベルメクチンの効果は正直，軽症・低リスク・若年が対象であればこんなものだろうと思いました（後述）。

デザイン

情報ソース：clinicaltrials.gov（NCT04405843）／ pubmed

─ ads ─

概要

EPIC：Estudio Para Evaluar la Ivermectina en COVID-19 trial

二重盲検ランダム化比較試験；DBRCT
2020年7月15日〜2020年12月21日
Cali市（コロンビアの都市）の小児感染症研究センター（Centro de Estudios en Infectología Pediátrica）が主体となって施行

PICO-T

まず概観を掴むため，PICO-T を箇条書きでまとめます。

Patient：参加者

── Fgure.1 ／Table1，本文記載より抜粋

参加者の概要

n=398 (*)
18歳以上の男女で
PCR陽性または迅速抗原陽性で確定された COVID-19 患者で
発症から7日以内の有症状・軽症者（無症候性は除外）。
州の電子データベース上からランダム抽出された人に意向調査し，
参加合意を得られた適格者が参加
なお，入院していたのは 4人（2vs2）しかおらず，ほぼ全員自宅待機症例

(*) ランダム化を受けたのは 476人だが，ラベルミスによる割付間違いで 76人除外，ランダム化の後にイベルメクチン内服歴が判明した 2人除外

｜軽症の定義: 自宅待機ないし入院していても高流量経鼻酸素投与やNIPPV・人工呼吸管理を受けていない

Intervention：介入群

治療介入

空腹時イベルメクチン水溶液 300 μg/kg 体重 × 5日間（n=200）

｜5日連続内服の妥当性: 単回投与が一般的な dose ですが，臨床試験で 5 日連続内服にする試験は過去にも先行例があります。一応小規模の先行研究で，この dose だと肺への移行性がよさそう，という知見があるからだそうです。ただ，日本では適応のない用法・用量です。なお水溶液というのもあまり見ないパターンですが，お国柄でしょうか。小児系の研究施設なのが関係あるかもしれません。

Control：対照群

コントロール群

空腹時プラセボ水溶液 × 5日間内服（n=200）

ただし，試験開始〜8月26日までは「5%ブドウ糖入り生理食塩水」と「5％ブドウ糖入り蒸留水」の混合液。味や匂いはイベルメクチンとは違う。8月26日以降は，イベルメクチンと味や匂いを同じにしたものに変更された。それまでの期間は，同一世帯内での治験参加が1人までと限定された（同一世帯内で盲検化が外れてしまわないように）。

｜イベルメクチンに有利なバイアス: いや最初からちゃんとしたプラセボ用意しておいてくださいよ！と言うのは当然のツッコミです。プラセボ比較試験としては結構ずさんな管理だなあと思ってしまいますね。ただしこれは，どちらかというとイベルメクチン群にとって有利、、なバイアスになります。なぜなら，途中で「自分は偽薬群だ！」と気づいてしまったプラセボ群の参加者は，症状の自己申告をどちらかというと悪い方向に報告する可能性が高いと考えられるからです。

手違いによる除外

ラベルミスで，2020年9月29日〜10月15日までの期間，プラセボに割り付けたつもりだった参加者は全員イベルメクチン群になっちゃっていたという事件が発覚（10月20日）
この事件のせいで盲検化が外れてはいない
この期間の参加者 76 名は両群とも解析から除外した

｜補足: いや杜撰スギィ！というツッコミも当然おきますよね。これでは。ただ，これは何か恣意的な群間不均衡を起こすものというよりは単純な手続き上のミスと思われるので，完全に解析から除外されている以上，結果の解釈を大きく歪めるものではないと考えられます。ITT 法ではなくなってしまいましたが…

Outcome(Endpoint)；評価項目

評価項目

元のPrimary outcome：8段階順序スケール（*）の2以上悪化 ➡︎ 有意差がつく気配がなさすぎて，試験途中で secondary outcome に降格
後付けのPrimary outcome：症状消失までの日数
Secondary outcome：2,5,8,11,15,21日目の段階の上記順序スケール評価

｜8段階の順序スケール

0 = no clinical evidence of infection；感染の傍証なし
1 = not hospitalized and no limitation of activities; 入院しておらず日常生活支障なし
2 = not hospitalized, with limitation of activities, home oxygen requirement, or both；入院していないが日常生活に支障あり，または在宅酸素
3 = hospitalized, not requiring supplemental oxygen；入院しているが酸素投与なし
4 = hospitalized, requiring supplemental oxygen；入院していて酸素投与あり
5 = hospitalized, requiring nasal high-flow oxygen, noninvasive mechanical ventilation, or both；入院していてNHFやNIPPV治療
6 = hospitalized, requiring extracorporeal membrane oxygenation, invasive mechanical ventilation, or both;　入院していてECMOや挿管人工呼吸器管理
7 = death；死亡

Time：時間

21日間追跡し，症状消失までの時間「Time to event」を解析。

備考（follow-up）

初回は治験担当看護師が自宅ないし入院施設に訪問し，問診（参加適格基準を満たすかチェック）&状態確認，血液検査を施行。
適格基準を満たせば治験薬（プラセボまたはイベルメクチン）が配られ，自分で内服するよう指示される。
2, 5, 8, 11,15, 21日目に，電話で治験スタッフから問診を受ける（＝自己申告）。
入院患者は，治験担当医師がカルテを確認する。
21日目の時点でボトルは回収されアドヒアランスを確認される

結果・結論

Result（結果）

Primary outcome（イベルメクチン vs プラセボ）：

症状消失までの期間の中央値 ── 10日 (IQR 9-13) vs 12 日 (IQR 9-13)
ハザード比 1.07 [95%CI: 0.87-1.32]
ログランク検定の p = 0.53(*)

──Table 2／Fg.2 より抜粋

┗━▶︎ 統計学的有意差なし

(*) ざっくり言えば「プラセボと差がない」という帰無仮説が正しくても，ランダム性のみによってこのようなデータ（生存曲線）が得られる確率が 53 % ある，ということ。

Secondary Oucome（イベルメクチン vs プラセボ）：

8点順序スケールの2点以上悪化 ── 4人 (2％) vs 7人 (3.5%) ; OR 0.56 [0.16-1.93]
発熱期間の中央値 ── 1.5日 (IQR1-3) vs 2日 (IQR1-3) ；差 0.5 日 [-1.0 to 2.0]
医療提供レベルを高めた(*) 人数 ── 4人 (2％) vs 10人(5％)
- (*) 新規入院，新規酸素投与開始，新規ICU入室，等の複合アウトカム
死亡 ── 0人 vs 1人

──Table 2 より抜粋

┗━▶︎ すべて統計学的有意差なし

※）全体にわずかにイベルメクチン群の方がよい傾向ではある

｜多重検定: 多重検定なので，もし二次評価項目で仮に有意差が出ていたとしても，新たに主要評価項目として再検証が必要です（※二次評価項目は探索的なものに過ぎない）

Safety Outcome（イベルメクチン vs プラセボ）：

内服中止する理由につながった有害事象 ── 15人(7.5%) vs 5人 (2.5%)
呼吸不全, 急性腎不全，多臓器不全 ── いずれも 2人 (1％) vs 1人 (0.5%)
上部消化管出血 ── 2人 (1％) vs 0人

── Table 3 より抜粋

┗━▶︎ すべて統計学的有意差なし

※）重要な有害事象は全体にイベルメクチン群の方が多い傾向ではある

Conclusion（結論）

結論

軽症かつ低リスク群（若年＋大きな併存症なし）では，イベルメクチンを内服しても，プラセボと比べて統計学的に有意な benefit はない
その他の患者層での有効性やリスクは今回の試験では不明
「もっと小さいが臨床上有意な benefit」に関しては，サンプルサイズ不足で検出できなかった可能性がある

Limitation

なお，筆者らが本文中で挙げている Limitation は 7つあります。

当初の試験デザインから変更している
power 不足で検出できていない効果がある可能性
ウイルス学的評価を行なっていない
最初の65人のプラセボは味が違った
患者申告という主観に基づくアウトカム評価になっている
血中イベルメクチン濃度は測定されていない
高齢者がほぼ参加していない

また，あえて追加で取り上げるとしたら，

群間不均衡がある（※高齢者割合，男性割合，喫煙者割合，ベースラインの重症度がいずれもイベルメクチン群有利に偏っている）
Intention-to-treat ではなく Full-analysis-set（※ラベルミスによる群間移動が多過ぎたせい）

などが limitation になります。

長くなるためこれらの解釈については次の記事で改めて取り上げたいと思います。

この試験のポイント（私見）

ここから先は私見です。

この試験を解釈する上で，重要なポイントは 4 つあると思いました。

テクニカル面の問題
対象者が軽症者かつ低リスク群ということ
プロトコル変更と power 不足の考え方
有害事象の捉え方

順に取り上げていきます。

① テクニカル面の問題

今回の EPIC-trial は，プラセボのラベルを取り違えていたり，味が変わってしまっていたりとテクニカルな問題が目立っています。

確かにこれでは物議を醸しても仕方ないと言いますか，おそらく RCT を早くスタートすることに注力し過ぎて，一部おざなりなまま始めてしまったのでは？と思います。

ここが批判にさらされるのは仕方のないことでしょう。

ただ，このテクニカル面の問題だけに囚われて「はいこの試験はダメダメです！終了！」と熱くなって「そっ閉じ」では勿体ない，吟味する価値のある論文だとは思いました。

割引きながら読めば，データを解釈することは十分可能です。

個人的には，いろいろな問題を差し引いても今回の「有意差なし」という結果に関しては，特に疑問はありませんでした。

これだけ軽症者かつ若年者にしぼって試験を行えば，まあそうなるでしょうという印象です。既報と比べて特別不自然な結果とも思いませんでした（後述します）。

② 対象者が軽症者かつ低リスク群

この試験は，組み入れられた参加者が全員「軽症者」であるだけでなく，39歳以下がおよそ6割を占める試験です。

そもそもこのような若年層ではほとんど重症化しないことは既知です。

その上，ほとんどの人がこれという併存疾患もありません。さらに，RCT に参加してくれるような健康志向が高くて元気めな人という選択バイアスも掛かっています。

また，試験参加時点で入院していたのは 4人だけで，99% は自宅待機者です。

当初の Primary outcomeである「2段階以上の順序スケールの悪化（＝重症化）」を満たす人がそう多くないだろうことは容易に想像がつきます。

最初の Power 計算が甘過ぎた

結局，論文著者らが最初に「中国の4万人程度のリアルワールドデータ（2020年初頭のデータ）」をもとにして power 計算をして，400人集めれば有意差が出るやろ！という設計にしてしまったのが問題でした。

「18％は悪化するはずだから〜」という前提での power 計算（＝必要な被験者数の推定）になってしまっています。

しかし蓋を開けてみると，この試験に参加した人はほとんどが若年の元気な自宅待機者ばかりでした。結果として，想定していた母集団からズレてしまい，プラセボ群すら 3.5 %しか悪化しなかった，という構図です。

当然 power（サンプルサイズ）が足りず「全く有意差が出ない」ということになります。

そこで〈症状消失までの日数〉なら「元気なひとが対象でも差を付けられるハズじゃろ！」と新しい primary outcome にすげかえたわけですが，それでも尚，結局有意差はつきませんでした。

｜自己内服している人がいる？: なお「プラセボ群の成績が良すぎるのは，こいつらもこっそりイベルメクチンを自己判断で買って飲んでいたせいだ！」という声もあるようですが，果たしてそうでしょうか。RCTに参加しながらそこまでイベルメクチンの効果を盲信して勝手な行動をとる人がどの程度いるか。万が一多少いたとしても，400人規模の試験結果を大きく歪めるほどにはならないと思いますが，如何でしょうか。それほどまでに「効く」というなら，イベルメクチン群はさらにもっと早く症状消失してくれてもいいような気もします。

③ プロトコル変更と power 不足の可能性

総じて，この試験の見方としては

「あまりにも軽症かつ低リスク群を対象としてしまったがために，プラセボ群もアウトカムが良過ぎて，ほとんど差がつけられなかった」

と捉えるのが妥当であると感じます。

ただし，論文著者らも述べているように，小さな効果は検出できていないだけの可能性はあります（＝power不足）。

power 計算結果が不変？

ここでツッコミどころとなるのが，

主要評価項目 primary endpoint を途中で変更しているにもかかわらず，power 計算結果が変わっていない（＝当初の予定通りの 400人で OK と計算された），という部分です。

普通 primary outcome が変更された場合，集めるべきサンプルサイズは多少なりとも変わるはずです。

しかしこの試験ではなぜか都合よく

当初の予定どおり 400 人であれば，新たに設定し直した primary outcome に対しても十分な検出力 power があると推算できたので，追加の被験者募集は不要だった

ということになっています。

結果として集めるサンプルサイズは変えず，当初の予定通り400人を集めて試験終了としています。これはさすがに多少恣意的な計算をし散らかしちゃったのでは？という疑念が湧くところです。

この点を強く批判する論者もいるようです。

Power計算に「正解」はない

ただ，そもそもPower の計算は「暗闇の中で黒猫を探すくらいの手探り」行為（by 新谷歩先生）であり，大きく外すこともよくあるものです。

Power計算が妥当だったかどうかは，蓋を開けてみるまで誰にもわかりません。

正解はないため，プロトコルを変える際にどう power を計算し直そうが，実際のところ研究デザイナーの自由です。あまりここを批判しても仕方がありません。

結局「計算上イケると思ったんですけど有意差が出ませんでした」，という今回のような結果になっても，特に不思議なことではありません。

ちなみに今回，研究チームは新しい primary outcome の power分析で，「症状消失までの期間を 3 日縮める前提で，ハザード比1.4 をきちんと検出できるようなサンプルサイズを計算」したそうです。両側検定 5 ％の有意水準と，80 % の power 検出力でデザインされています。つまり 20 %は βエラーになる可能性を見込んだ設計になっています。

また，サンプルサイズを急に増やそうと言ったところで，資金源の兼ね合いなどもあり，限界はあることでしょう。

なんにせよ400人という被験者を集めたのは事実であり，そのサンプルサイズでは検出できない程度の効果しか示せなかったのも事実です。

そして，それは対象者が軽症・若年低リスク群であったことが大きな要因と考えられます。

もし power 計算をもっと厳しく行って，もっとたくさんの被験者を集めていたら，有意差がついたかもしれませんが…… それほど沢山の被験者を集めないと検出できないような「小さな benefit」を追いかけ続けても，臨床的なメリットは大きくありません。

それよりは，もともと重症化リスクの高い高齢者など，ハイリスク層を中心にしたデザインの試験を行うのがよいと考えられます。個人的にはそういう試験にこそ興味があります。

もし仮にサンプルサイズが大きければ？

Power 不足を強く問題視する人の意見は，要するにこうです。

この試験は筆者らが power 分析を適当にしたせいで全然サンプルサイズが足りなくて有意差が出なかっただけだ！本当はイベルメクチンは効く薬なのにデザインが悪かったんだ！

この主張は，一部に関しては正しいと思われます。

たとえばこの試験が10倍のサンプルサイズ（4000人）で行われていたら，結果が「有意差あり」となった可能性はあります。

主要評価項目もそうですが，二次評価項目についても，すべて僅かにイベルメクチン群の方が良い傾向であったのは事実です（▼）。

症状消失までの期間の中央値 ── 10日 (IQR 9-13) vs 12 日 (IQR 9-13)
8段階順序スケールの2点悪化 ── 4 人（2 ％）vs 7 人（3.5 %）
発熱期間の中央値 ── 1.5日（IQR1-3）vs 2日（IQR1-3）
死亡 ── 0人 vs 1人（0.5%）

──Table 2 より抜粋

たとえばこの試験が 4000人（2000vs2000）で組まれていたなら，そしてさらに「8点順序スケールで2点以上の悪化」というイベントが全く同じ割合で起きていた、、、、、、、、、、、、ならば，40人（2%）vs 70人（3.5%）というアウトカムの差になります。

そのような大規模試験でそれだけの差がつけば，統計的有意となっていたかもしれません。

わずかな benefit を一生懸命検出しても仕方がない

しかし，膨大な被験者を募ってまでそのような小さな差を一生懸命「検出」する必要はどの程度あるでしょうか。

先述のかなり都合の良い計算上、、、、、、、、、、、でも，結局，利益を享受できるのは 2% と 3.5 % の差である 1.5 %の人のみです。つまり，2000人に投与して 30 人程度が助かるだけです。

実際にはサンプルサイズが大きくなれば〈平均への回帰〉が起きますので，むしろ差はもっと小さくなる可能性が高いと思われます。

残念ながら，そのような小さな benefit を一生懸命検出することには，臨床上の意味が乏しいと言えます。

仮に「わずかなbenefit」を検出できたとしても，コスパが悪すぎるため，医療経済的にはむしろマイナスの可能性すらあるからです。

いたずらにサンプルサイズを大きくしても「見過ぎによる出過ぎ」を招くばかりです。

カブトムシを採りにいくとき，顕微鏡を持って森に入り，小さな羽虫まで見つけ出そうとする人はいません（たとえが下手くそ）。

その点で，今回は

軽症・若年・低リスク群を対象にイベルメクチンを処方しても，400 人程度のサンプルサイズでは検出できない程度の効果しかなさそう

ということが見えてきただけでも意義があると考えられます。

④ 有害事象の解釈

重大な有害事象はイベルメクチンの方が多い

なお，もう1つ注目すべきは，〈内服中止の理由になった有害事象〉Adverse events leading to treatment discontinuation です。

これはイベルメクチン群が多く，15人（7.5%）vs 5人（2.5%）です。

また，その他の〈重篤な有害事象〉についても，上記のように，若干イベルメクチンに多い傾向があります（▼）。

内服中止する理由になった有害事象 ── 15人(7.5%) vs 5人 (2.5%)
呼吸不全, 急性腎不全，多臓器不全 ── いずれも 2人 (1％) vs 1人 (0.5%)
上部消化管出血 ── 2人 (1％) vs 0人

── Table 3 より抜粋

もちろん実数として非常に少ないので，これらの差は有意ではありません。よほど偶然誤差の範疇だとは思います。

しかし，それは primary outcome や secondary outcome も同じだったハズです。

つまり

今回，この論文で有意差が出なかったのは power 不足のせいだ！

と主張する人たちは，

こちらの「害」についても「power不足」の可能性を考えなければフェアではありません。

二枚舌はよくない

先ほどと同じように，この試験が 4000人という10倍の規模の試験だった場合のことをシミュレーションしてみます。

そうすると，もしこのままの割合で同じだけイベントが起きるのであれば〈有害事象による中断〉も 150人 vs 50 人となっていたかもしれません。〈消化管出血〉は 20人 vs 0人だったかもしれません。

そうなれば，これらの「害」も〈有意差〉として検出されていたかもしれません。

もちろん先ほどと同様に，実際には〈平均への回帰〉のためにもっと割合は低くなることが想定されます。

要するに何が言いたいかというと，

「効能」の部分だけ「power不足に過ぎない」と主張するのは論理的ではない

ということです。

「害」も「power不足に過ぎなかった」可能性がある

からです。

フェアな視点で冷静な計算をしていただければ，結局検出できなかった「小さな benefit」ばかりを強調することはできないことは明白でしょう。

「riskとbenefitを天秤にかけたとき，本当に処方する意味がある薬か」という臨床的疑問に対して，この RCT が提供する結論は

「軽症・低リスク・若年群」が対象では， benefit が明確とは言えない

ということです。

なぜかプラセボで多い消化器症状

ちなみに余談ですが，この試験では両群ともかなり消化器症状が多いのも気になるポイントではあります（▼）。

下痢 ── イベルメクチン群 52人（26％）プラセボ群 65 人（33％）
腹痛 ── イベルメクチン群36人（18%），プラセボ群 49人（25 %）
悪心 ── イベルメクチン群 46人（23%）プラセボ群 47人（24 %）

イベルメクチンで消化器症状は有名ですが，それにしても両群とも多いです。百歩譲ってイベルメクチンは 5 日も飲めばこのくらい下痢を起こしうるのかもしれませんが（それにしても多い），プラセボ群でも 3人に1人下痢を起こしているというのは，ちょっと異様な感じです。
COVID-19による下痢症もあるでしょうが，これほどの割合にはならないでしょう。もしかしたらプラセボの中身があまりお腹によくない物質だったのかもしれませんね🤔 それともコロンビアの水質が悪いのか・・
まあそもそも全て「電話での自己申告」なので「どの程度から申告していたのか？」という疑念はあります。ちょっとお腹ユルんだくらいのも全て報告しているのかもしれません。そうなってくると評価が難しくなります。
だからこそ，自己申告によるバイアスが大きくなりにくい「重篤な有害事象」や「内服中断につながった有害事象」に着目することが重要と考えられます。
「試験参加を取りやめたい！」と申し出るほどの有害事象がイベルメクチン群で多かったのは事実で，15人（7.5%）vs 5人（2.5%）でした。これらはある程度リアルな反応を反映しているのではないか，という印象です。

社会的インパクト

今回，この論文自体にというよりは社会の反応について色々と思うことが多くありました。

初めてマトモに publish された中規模 RCT

これまでイベルメクチンの「有効性」を謳ってきた極小規模〜小規模の RCT は複数ありますが，きちんと peer-review を受けたジャーナルに投稿されたものはほとんどありませんでした。

中には別記事で解説したようにムチャクチャな統計をやってるものもありました。

今回，ようやくちゃんとそれらしい形の論文が出てきた，という感じです。

おそらく

まともなサンプルサイズで
まともなジャーナルに投稿された
イベルメクチンの軽症早期患者のRCT

はこの試験（EPIC trial）が初でしょう。

注目度が高かった分，批判には晒されやすかったものと思います。

そのような中で，重大なプロトコル変更があったり，ラベルミスやプラセボの味が違うなどという冗談みたいな事件が途中で起きていたりで，物議を醸したのも当然かなとは感じました。

ヒステリックな批判

ただ，やや気になっているのは，何故かこのたった一本の論文で

イベルメクチンの神性が穢された！

とでも言わんばかりのヒステリックな批判をしばしば見かけることです。

SNS のみならずJAMAのコメント欄の反応も，一部「こんな問題だらけの論文でイベルメクチン様の素晴らしさを否定しやがって！！」と言わんばかりの勢いを感じます。

しかし，果たしてこの1本の論文でそこまで大騒ぎする必要があるのでしょうか。

「効かない」を証明した試験ではない

今回の論文で検証された〈帰無仮説〉は

イベルクチン群とプラセボ群では〈症状消失までの期間〉に差がない

というものです。

そしてこの研究では，その帰無仮説を棄却できなかった、、、、、、、、。それだけのことです。

「差がない」ということが〈立証された〉わけではなく，
「差がない」という仮説が〈棄却できなかった〉のです。

この2つは似ているようで全然意味が違います。

ちなみに「差がない」ことを〈立証〉するのは結構大変で，それ用の〈同等性試験〉を組まなければなりません

しかし一部の反応を見ていると，この〈仮説検定〉の結果の解釈を誤解してしまっている人が一定数いるように感じます。

今回は

コロンビアの単地域の，軽症かつ低リスク群対象で，400人程度のサンプルサイズでは「ランダム誤差で起きうる程度の差」しか出なかった

というだけのことです。

これによって「イベルメクチンは古今東西のCOVID-19に対して効かない、、、、」という理屈にはなりません。

たくさん論文が出れば negative なものも positive なものも出てくるでしょうが，今回のセッティングでは negative だった。それだけのことです。

ですから本来，そもそもヒステリックに反応する必要はないはずです。

今後この規模の RCT がいくつか集まれば，メタ解析が行われ結論が明確になっていくものと思われます。

本質的な〈効果〉を示せた RCT はこれまでも存在しない

そもそもなぜ現時点の貧困なエビデンスで

イベルメクチンは絶対に効くはずなのに効いていない！
この試験結果は絶対におかしい！

という論調になる人が出てしまうのか，不思議に思います。

この試験（EPIC trial）に多々「えっ？」となるところがあったのは事実ですが，これだけ軽症者かつ若年が対象なら，アウトカムは妥当なセンだと感じますし，これまでの既報とも大きくズレていないのではないでしょうか。

そもそもこれまで（〜2021. 2月まで）の RCT も「症状」や「重症化予防」に関してはそのほとんどが negative study ばかりだったはずです。

「ウイルス RT-PCR陰性化が若干早くなる」という傾向が，ごく小規模の低質かつ peer-review もされていないような試験でいくつか集まっていた程度です。

ですから今回の研究結果も，むしろこれまでの結果とは合致する方向性です。

いままでたくさんのRCTで効果、、が出てるのに！

と主張している人は，おそらくそれらの論文（にすらなっていないデータも多いですが）をきちんと読んでいないか，「効果、、」という定義に関して何か誤解があるのではないかと思います。

ぜひもう一度冷静に読み直して頂きたいです。

面倒な方のために，この辺りの問題をまとめた記事もご用意しております。

後方視研究は，RCT と同一の扱いはできない

因みにイベルメクチンの有効性を示した研究としてよく引用される Chest. の論文（Chest. 2021 Jan;159(1):85-92）は「重症者を対象にとにかく色んな薬を投与しまくっていた臨床現場の成績を後ろ向き解析したもの」に過ぎません。

そのため，前向きの RCT と全く同列には語れません。

後ろ向き研究では，筆者がその気になれば「有意差」などいくらでも演出できます。

Propensity score match でも，どの交絡因子をスコア計算に入れるかで結果は容易に変わり，数字を微調整、、、することが可能です。

ですから，後方視で得られた知見は何であれ，いずれも仮説〈提唱〉の扱いなのです。〈検証〉や〈立証〉に用いるものではありません。

後方視研究で示せるのはあくまで「相関関係」であって，「因果関係」ではない のです。

｜後ろ向き研究は解釈が難しい: Chest. の論文では，イベルメクチンを単剤で内服していた人はほとんどいません。コントロール群も同様で，プラセボではなく色々な薬を使っています。つまり，いずれの群も多剤併用療法がされており，それらの割合をいくら propensity score で解析上は揃えた、、、、、、、と言われても，結果の解釈はかなり慎重に行うべきです。また，そもそも Chest. の論文の対象者は重症者です。今回の研究とはまるで背景が違います。

「効く」という確証バイアス

今回の論文に対して強く反発している一部の方々の反応を見ていると，少し気になることがあります。

それは，この論文のことは執拗に袋叩きにしているのに，いっぽうでは ivmmeta.com みたいなめちゃくちゃなメタ解析（別記事で解説）を拡散していたりと・・論文の批判的吟味の仕方に一貫性を感じられない人がいる，ということです。

「有効性を謳う論文」だけを受け入れて「有効性を示さなかった論文」を執拗に叩くというのは問題のある姿勢ではないでしょうか。

心理学では〈確証バイアス〉と言いますが，あらかじめ自分の中で確固たる結論が決まってしまっていて，それに都合のよいデータばかりを集めてしまい，合わないデータを徹底的に排除しようとする心理状態になってしまっているかのようです。

ひどいものだと

ワクチン利権のやつらの陰謀だ！
効果的なはずのイベルメクチンを消そうとしているんだ！

と陰謀論を騒ぎ立てる人もいるようですが……

そこまで行くと，もはや「信仰」の領域です。

もちろん信仰は個人の自由ですが，こと医学的データに関しては，私はきちんと科学の俎上で対話していく土壌ができて欲しいと感じます。

今後もきちんと冷静な議論が進むことを期待したいですね。

ivmmeta.comはまだ 100% 神話

ちなみに，問題だらけのメタ解析として当サイトでもたびたび御紹介している ivmmeta.com は，早速今回の JAMA 論文も統合しています（▼）。

– 最下段の Lopez-Me..(DB RCT) が今回のデータです

さすが仕事が早いのですが，相変わらず「全然違うアウトカム」同士を統合しているムチャクチャな表です。

明らかな negative study である今回の論文を踏まえた上でも，いまだに 100 % 「positive results」と記載しておりました（▼）。

まだ100%神話

うーん，ブレないですねぇ…。

あくまで他国の限られたデータ

最後に，繰り返しになりますが，この研究はそもそもコロンビアの単一地域の RCT です。

規模も中程度であり，日本や欧米諸国の医療に対する〈外的妥当性〉は低いと考えられます。

ですから当然，この論文1本で「有効」だの「無効」だのと言えるものではありません。

人種差の問題もありますが，せめて日本と同等レベルの医療体制の国の RCT が出てきて欲しいところですね。

もちろん，日本でも若年軽症者を対象にすれば似たようなシブい結果になる可能性は高いと考えられます。現在進んでいる日本の第 II 相がどの程度高齢者を recruit できているか，結果を待ちたいと思います。

総括

この記事では，EPIC trial の概要と，それに対する私見をまとめてみました。

次回は〈爆速チェックリスト〉を用いてこの論文を更に深く掘り下げたいと思います。

この試験の結果を解釈する際に重要となる limitation についても踏まえながら，〈批判的吟味 critical applausal〉をおこなってみます。

次の記事へ

合わせて読みたい

【30分で】臨床試験 RCT 爆速チェックリスト【批判的吟味】

職場の論文抄読会で，臨床試験論文の〈批判的吟味 critical apprausal〉をしたい！でもどういう部分に気をつけて読めばいいか分からない！そんな時，臨床試験の質を『爆速で』チェックできる手頃なリストがあったら，便利[…]

[おすすめ本紹介]

Users’ Guides to the Medical Literature

タイトル通り「医学論文を現場でどう応用するか？」迷える臨床家のためのユーザーズガイド。Tips 集のような構成で，どこからでもつまみ読みできます（通読向きではない）。医学論文の批判的吟味を学ぶにあたり 1 冊だけ選ぶならコレ，という極めて網羅性の高い一冊です。著者 Gordon Guyatt 氏は “EBM” という言葉を作った張本人。分厚い本ですが，気軽に持ち歩ける Kindle 版はオススメです。邦訳版もあります。

Amazon で見る

楽天市場で見る

医学文献ユーザーズガイド第3版

表紙が全然違いますが「Users’ Guides to the Medical Literature (JAMA)」の邦訳版。医学文献を批判的吟味するためのTips集としてかなりの網羅性を誇る代表的な一冊です。唯一の欠点は Kindle版がないこと（英語版はある）と，和訳が気になる部分が結構あること。２つでした。原著とセットで手に入れると最強の気分を味わえます。鈍器としても使えます。