【新型コロナ】イベルメクチン vs 進行期症例の臨床試験(イラン第 II 相)

この記事は,前回記事の補足(- part 3)です。
前回記事

注:誤解のない様,最初に明記しておきます。筆者はイベルメクチンの COVID-19 への有効性については中立〜むしろ期待している立場です。死亡や挿管などハードエンドポイントを検証する大規模二重盲検 RCTを期待しています。恐怖のメタ解[…]

COVID-19 への効果が期待されているイベルメクチンですが,有効性が十分検証される前から効果を喧伝する風潮が目立ちます。一例として ivmmeta.com という極めて危険な統計を行っているウェブサイトを取り上げました。イベルメクチンの COVID-19 への効果を検討した〈メタ解析〉を行っているサイトで,一見それらしい図表をたくさん載せていますが,残念ながら統計手法に致命的な欠陥があります。鵜呑みしてしまうのは非常に危険ですよ,ということをお伝えした記事です。
補足記事

この記事は,前回記事の補足(-part 1)です。[sitecard subtitle=前回記事 url=/med/ivmmeta/]COVID-19 への効果が期待されているイベルメクチンですが,まだ結論が明確でないうちか[…]

補足として,実際に ivmmeta.com 上で〈Early Treatment〉(軽症・早期)のランダム化比較試験 RCT として取り上げられていた 6 つの論文データを吟味した記事です。日本で 2021 年 2 月現在進行中の RCT(phase II)も紹介させて頂きました。
補足記事

この記事は,前回記事の補足(-part 2)です。[sitecard subtitle=前回記事 url=/med/ivmmeta/]COVID-19 への効果が期待されているイベルメクチンですが,十分な検証がなされる前から効[…]

さらに〈予防内服〉の 3 つの RCT 結果もまとめました。

はじめに

この記事では引き続き,ivmmeta.com が統合している RCT(▼) の吟味を継続していきます。


このフォレストプロットが「ムチャクチャな統計」ですよ,という話は前回記事の内容なので,あえてここでは取り上げません。基本的に(書いてある数字は無視して)RCT を縦に並べてまとめてくれている便利な表としてだけ使っています。

今回はこれらの中から〈Late treatment〉(進行期治療)の試験(▼)を実際に読んでいきます。



ここに記載されている RCT は 8 つです。

これまで〈Early treatment〉では 6 本の RCT を,〈Prophylaxis〉では 3 本の RCT を全てまとめて参りましたので,ここでも踏ん張って 8 本すべてをまとめていきたいと思います!

……と,当初は意気込んでいたのですが,さすがに preprint の論文ばかり見るのも 飽き ……力尽きてしまったので,この記事では 1 本分しかまとめられませんでした。

読んだ論文

とりあえず「進行期」の治療に関しては,この表(▼)をぱっと見た限り



  • それなりのサンプルサイズで
  • 二重盲検試験ダブルブラインド
  • 有意差がついている

のは Niaee らのものだけでしたので,この記事ではもっぱらこの試験の内容を吟味していきたいと思います。

Late treatment

ivmmeta.comより

── ivmmeta.comより転載
注:ivmmeta.com 上で〈Late treatment〉とされている試験は,ある程度症状が「進行期」となった人を対象とした RCT を指します。
─ ads ─

Niaee らの RCT(@イラン)

この試験は preprint(査読前論文)です。結果の解釈は非常に慎重に行わなければなりません。

情報ソース:Research squareivmmeta.com

PICOと結果

試験の概要
[P]参加者PCR で確定された COVID-19 軽症〜重症 入院患者(n=180)
[I]治療介入
  • イベルメクチン投与;投与用量や回数によって,4アームに分割
  • 下記 いずれの群も n=30 (× 4)
    • Arm1: イベルメクチン単回投与 (200 μg/kg)
    • Arm2: イベルメクチン3日投与 (200 μg/kg)
    • Arm3: イベルメクチン単回投与 (400 μg/kg)
    • Arm 4: イベルメクチン3日投与(400, 200, 200 μg/kg)
[C]比較対照
  • なぜか コントロール群も 2 アーム
    • 下記いずれの群も n=30 (×2)

    • イランの通常レジメン(=クロロキン 200mg/kg ×2回
    • プラセボ+イランの通常レジメン(同上
[O] 主要評価項目臨床的な改善(45日間フォロー)

– 解熱/呼吸数正常化/SpO2 が酸素なし 94% 以上,という状態が 24時間以上持続
Results
備考二重盲検,phaseII 試験。コントロール群がクロロキン(±プラセボ)であることに注。ほぼ全症例がCT上肺炎像あり,画像上の重症度がmild-moderateから87%程度。SpO2のベースラインの中央値は89(IQR 85-91)。参加者の年齢中央値は 56歳(IQR45-67)歳。

第 II 相試験

180人集めていますが,介入群 4アーム,対照群 2アームの合計 6アームに分けた試験デザインです。そのため,1群あたりの人数は 30 とかなり小規模になってしまっています。当然結果が大きくバラツキやすいことが想定されます。

「用法・用量を検討する」という原義に忠実な phase II(第II相試験) らしい設計ではありますが,Arm1〜Arm4 でアウトカムに大きな差がないため,結局どの 用量 が良いか悪いかは,この試験ではハッキリと分かりません(▼)。


── Researchsquare より,Table 3.

一応 筆者らはArm 3(つまり 400μg/kg 単回投与)の 用量 を推奨しているようです。なぜなら,最も死亡率が低く(0%),入院期間が短く(5日),SpO2低下期間が短かかった(2日)から,だそうです。

が,皆様は上表を見て,どうお感じになるでしょうか。
Arm 3 が特別よい成績と言えるでしょうか。

「実数としての差」は臨床的に有意か?

結果の表を見ると,実際にはどの群もほとんどアウトカムに差がないように見えます(▼)。


頻呼吸の改善はどの群も大抵 2─3 日,解熱は大抵どの群も 0-1 日,酸素飽和度が低下していた期間は 3-5 日,入院期間は大体 6-8 日です。ほとんど実数としての差がついていない様に見えます。特にバラツキの範囲をみると,ほとんどカブっている様に見えます。

統計的には有意になった項目がいくつかあるようですが,実数差がないので,残念ながら〈臨床的に有意〉ではなさそうです。

多重検定を補正していないという問題もあります。

対照群がクロロキンという問題

また,この試験当時はクロロキンが標準レジメンだった様です。そのためコントロール群がクロロキンの試験である,というのは結構大きな問題です。

COVID-19 が蔓延し始めた当初は,クロロキンの効果にも一定程度の期待が集まっていた時期があったことは事実です。当初は EUA(緊急使用許可)も出ていたため,実際多くの国で投与された経緯があります。

しかしデータが集まるにつれ有効性が疑問視される様になりました。結果として現在「十分な有効性が乏しく,リスクの方が大きい」という暫定的な結論になっています。

そのため,クロロキンをコントロール群として比較してしまっている本試験は,そもそも結果を現在の診療に当てはめることはできません(そのような比較対照は現在もはや実在しないため)。

補足|現在は使わないクロロキン
  • COVID-19 に対するクロロキンの使用は安全性上の懸念があって,現在は基本的に使用を推奨されていません。途中解析で死亡率が高すぎたために早期終了した RCT もあります。──JAMA NetW open. 2020;3(4) e208857. Epub 2020 Apr 24/NCT04323527
  • UpToDate®︎ 上でも “We suggest not using hydroxychloroquine or chloroquine in hospitalized patients given the lack of clear benefit and potential toxicity” とされています(2021.02.06 現在)。

対照群で異様に多い死亡

また,この試験は 死亡がコントロール群で非常に多いのが気になります。

50 代が年齢中央値の試験で クロロキン群の 死亡者 5/30 [16.7%],プラセボ+クロロキン群の死亡者 6/30 [20%] というのは異様な感じがします。

基本的には酸素を要する程度の COVID-19 症例が対象の臨床試験であるため,無症状や咳のみの軽症などの人を含めた母集団(死亡確率 〜3 % 程度 )よりはリスクが高い集団を対象としているのは間違いないのでしょうが,それにしても死亡が多すぎる印象です。

一方のイベルメクチン群の4アームでは死亡者数が 3/30, 0/30, 3/30, 1/30 。つまり死亡割合は 3.3〜10% で,こちらは妥当な印象です(逆を言えば,特別良いという印象も受けません)。

こうなってくると,もはやイベルメクチンが良いのではなくクロロキンが悪いのでは?という解釈もできてしまいます。

結論:あくまで phase II

この試験結果から,本邦でのイベルメクチンの有効性を論じることはできません。

そもそも phase II(第 II 相試験) と明記されている試験ですので,どの用法・用量が妥当か判定するための試験に過ぎません。

本当に、、、効くのか?を検証するための試験ではないというところに注意を要します。

おそらく今後行われるであろう phase III(第 III 相試験)では,どれか 1 つの用法・用量に固定した上で,プラセボ比較二重盲検で本当に意味のあるエンドポイントでの有意差を検証することになるものと思われます。

メタ解析ではどう扱われているか

ivmmeta.com での扱い

ちなみに,ivmmeta.com のメタ解析ではこの試験結果をどのように扱っているでしょうか(▼)。


下から 3 つ目の Niaee(DB RCT)が,今回見てきた RCT です。

この表を見てみると,Niaee らの試験は「死亡」がリスク比 0.18(95% CI 0.06-0.55)と書いてあり,統計的にも有意かのように扱われています。

しかし注意すべきなのは,このリスク比は,現実には存在しないバーチャルな数値だということです。

というのも,イベルメクチン群の全ての用法用量(つまり Arm1〜4 全員)の死亡の合算(4人/120人)と,コントロール群(クロロキン群+クロロキン&プラセボ群)の死亡の合算(11人/60人)を比較してリスク比を算出しているからです。

要するに「用法・用量問わず何らかの形でイベルメクチンを内服した群」 vs 「クロロキン ± プラセボ内服群」での平均的な比較,という形になっています。非常に分かりにくい比較です。

分子も分母も,いずれも合算データになっている,ということです。現実には全く別の内服を 30 人ずつしているにもかかわらず,120人と 60人でそれぞれ平均をとって,そのリスク比を比較しているのです。

現実には「平均的な量を内服した人」など存在しないので,平均を取ることの意義は慎重に考えなければなりません。当然ながら,合算で得られた値は非常にバーチャルな数字になります。

4/120,11/60 という数字は実在しません。リアルなデータはあくまで下表(▼)です。


  • クロロキン群(S群)で 死亡 5/30(16.7 %)
  • クロロキン+プラセボ群(P群)で 死亡 6/30(20 %)
  • Arm 1(イベルメクチン 200μg/kg 単回)で 死亡 0/30 (0 %)
  • Arm 2(イベルメクチン 200μg/kg 3回)で 死亡 3/30 (10 %)
  • Arm 3(イベルメクチン 400μg/kg 単回)で 死亡 0/30 (0 %)
  • Arm 4(イベルメクチン 400-200-200 3回)で 死亡 1/30 (3.3 %)
たとえば P 群と Arm2 の比較では死亡の差は統計的に有意になりません

問題だらけのメタ解析

他にもこのフォレストプロット(▼)には色々と大きな問題があるのですが,すでに前記事で取り扱った内容ですので,詳細は割愛します。



とりあえず,この表の最下段

1,358 patients リスク比0.50 [0.30-0.83]   50% improvement

という記載については真に受けるべきではありません。
以下の重大な問題があるためです。

  • Niaee らの RCT は「死亡」を〈主要評価項目〉にした試験ではなく〈後付け解析〉に過ぎないにも関わらず,その差を取り上げてメタ解析に投入している
  • Niaee らの RCT はコントロール群がクロロキンなのに,コントロールがプラセボの試験と統合している
  • 全く異なるアウトカムのリスク比を「統合」している(death と recovery)
  • サンプルサイズが非常に小さい試験が多く含まれている。同規模の試験で芳しくない結果となった RCT は報告されずに葬り去られている可能性がある(=出版バイアス)。
詳細はコチラ

注:誤解のない様,最初に明記しておきます。筆者はイベルメクチンの COVID-19 への有効性については中立〜むしろ期待している立場です。死亡や挿管などハードエンドポイントを検証する大規模二重盲検 RCTを期待しています。恐怖のメタ解[…]

まとめ

イランで行われた,Niaee らによる第 II 相試験のデータを吟味してみました。

Niaee らの第 II 相試験 まとめ

  • 入院症例 180 人対象,酸素飽和度のベースライン 89(IQR 85-91)
  • 6 アーム× 30 人と各群のサンプルサイズが小さい
  • 比較対照がクロロキン(現在は推奨されない薬剤)
  • アウトカムの実数差ほぼなし
  • 対照群の死亡が多すぎる(16.8%〜20%)

結局,この試験で「イベルメクチンの有効性」を論じることは難しいですね。

これまで「予防内服の RCT 3本」「軽症・早期治療 の RCT 6 本」 にもザッと目を通してきましたが,どれも本質的な検証という点ではまだ不十分です。

期待できる部分はあるものの,本当に効く、、、、、のか」は〈未検証〉というのが現実の様です(2021年2月現在)。

臨床的意義のあるアウトカム* について〈検証〉した二重盲検プラセボ比較のランダム化比較試験 RCT(第 III 相試験)が待望されるところです。

* 死亡の回避>挿管の回避>酸素吸入の回避>症状消失までの期間短縮

まずは日本で行われている第 II 相試験(jRCT: 2031200120;CORVETTE-01)の結果に期待したいと思います。

[おすすめ本紹介]

ファクトフルネス FACTFULNESS


ビル・ゲイツが希望者全員に配布したことで有名な世界的超ベストセラー。スウェーデン医師・国際保健学教授である筆者が,誰もが勘違いしている「世界の事実」を1つ1つ挙げながら,本質を歪めて見てしまう人間の本能・バイアスを列挙していきます。脳髄に金槌で釘を打ち込まれるくらいの衝撃を何度も与えてくれる名著です。やや分厚い本ですが,Audible なら通勤時間で聞けてしまうので,大変オススメです。

─ ads ─
>医療統計の解説チャンネル

医療統計の解説チャンネル

スキマ時間で「まるきりゼロから」医療統計の基本事項を解説していく Youtube チャンネルを 2 人で共同運営しています。

CTR IMG