【新型コロナ】イベルメクチン vs 軽症早期症例の臨床試験 RCT 6 本 まとめ

この記事は,前回記事の補足(-part 1)です。
前回記事

注:誤解のない様,最初に明記しておきます。筆者はイベルメクチンの COVID-19 への有効性については中立〜むしろ期待している立場です。死亡や挿管などハードエンドポイントを検証する大規模二重盲検 RCTを期待しています。 恐怖のメタ解[…]

COVID-19 への効果が期待されているイベルメクチンですが,まだ結論が明確でないうちから,効能を極端に喧伝する風潮が目立ちます。その中で,前回記事では ivmmeta.com という極めて危険な統計を行っているウェブサイトを取り上げました。過去の文献をまとめる〈メタ解析アナリシス〉を行っており,一見それらしい図表をたくさん載せていますが,残念ながら統計手法に致命的な欠陥があるため,鵜呑みしてしまうのは非常に危険ですよ,というのがこの記事でお伝えした内容です。

はじめに

ivmmeta.com が統合している RCTは以下です(▼)。



今回,この記事では〈Early Treatment〉の RCT に絞って,実際に論文の吟味を行っていきたいと思います(▼)。


このフォレストプロット自体が戦慄を覚えるくらい「ムチャクチャな統計」ですよ,という話は前回記事の内容なので,あえてここでは取り上げません。基本的に本文中でこの表を出すときには,単に RCT を縦に並べてまとめてくれている便利な表としてだけ使っていますので,ご留意ください。

本来は〈メタ解析〉を行う人がきちんと個々の試験のバイアスリスクを評価してから結果を〈統合〉すべきです。しかし残念ながら ivmmeta.com ではそうした評価が全くされていません。とにかく全研究から都合の良いデータだけピックアップして統合しているという状態です。

そこで,読者である私たちが直接〈一次情報〉にアクセスし,批判的吟味を行う必要があります。

というわけで,自分なりにデータを読んで私見をまとめてみましたので,何かの参考にしていただければ幸いです。

|補足:一次情報と二次情報
メタ解析は〈二次情報〉です。 RCT など,先行する研究(一次情報)から,ivmmeta.comの作者らが恣意的に結果を「解釈」し,統合しています。このプロセスで必ずバイアスが入ることを意識しなければなりません。もちろん,当サイトも二次情報ですので,私の記載を鵜呑みにせず直接元文献をお読みになることを推奨します。私が読み間違えたりしている部分もあるでしょうし…;

注意事項(前がき)

辛めの記載に見えるところがあるかもしれませんが,警鐘を鳴らす目的ということで,御容赦下さい。

この記事では,各研究のバイアスリスクの評価に加え,主に「試験結果を臨床的に有意、、、、、、と思えるか思えないか」という基準で判断していきます。

改善すべきは「データ」ではなく患者さんの転帰であり,その本質的な部分で差が示せていないのであれば,基本的に臨床現場にとって意味がない,ということです。

本頁で取り上げるのはランダム化比較試験 RCT のみです。後ろ向きの観察研究は基本的にバイアスリスクが高く,結果の解釈が難しいため,今回は割愛します。

軽症早期 COVID-19 対象のイベルメクチンRCT

では早速〈Early treatment〉(発症早期・軽症患者対象の)ランダム化比較試験 RCT を,上から順に見ていきましょう。



この最下段,Early treatment を統合して 71 % improvement(改善)と主張していますが,その内情が実際にどんなものなのか,個別に評価してまいります。

─ ads ─

Ahmed らの RCT(@バングラデシュ)

── International Journal of Infectious Diseases 103 (2021) 214–216



まずは1行目,Ahmed らの RCT を吟味します。

バングラデシュの二重盲検 RCT です。72人 の参加者を集めてますが,3アーム に分けているため,結局は 1 群あたり24 人ずつという極小サイズ になっています。パイロット試験のサイズ感ですね。

PICOと結果

試験の概要
[P]対象者 COVID-19 発症早期の入院症例(n=72)
[I]治療介入群 ① 経口イベルメクチン12mg/day ×5日間 (n=24)
② 経口〈イベルメクチン12mg+ドキシサイクリン 200mg〉1日+ドキシサイクリン100mg 4日(n=24)
[C]比較対照 プラセボ(n=24)
[O]主要評価項目
  • 鼻咽頭スワブでの RT-PCR陰性化までに要した日数
  • 7日以内の解熱・咳消失
試験結果 主要評価項目(PCR 陰性化までの日数)は,イベルメクチン群 9.7 日(95% CI 7.8–11.8)vs イベルメクチン+ドキシサイクリン群 11.5 日(95% CI 9.8–13.2)vs プラセボ群 12.7 日(95% CI 11.3–14.2)
備考 参加者は誰も酸素を吸入していない軽症

この試験の Limitaion

  • 途中離脱の割合が高い:割り付け後,試験参加を取り消したのがイベルメクチン群で2名,イベルメクチン+ドキシサイクリン群で1名,プラセボ群で1名。結果として 22人:23人:23人での試験となる(ITT解析の記載なし)。
  • 欠測データが多い:さらに,イベルメクチン群で 5/22 人,プラセボ群で 4/23 人 Lost-to-follow-up している。これらの欠測データに関して行った対処の記載もない。
  • 入院期間は差がない:プラセボ群,イベルメクチン群,イベルメクチン+ドキシサイクリン群の順に 9.7 日 vs 10.1 日 vs 9.6 日(=臨床的意味のあるアウトカムは達成していない)
  • 製薬会社資本(COI はないらしい)
  • 論文の receive から accept まで 2日(!?)
  • 本文中,頻回に統計的有意 significant と主張しているが,多重検定の補正なし

ivmmeta.com のメタ解析

ivmmeta.com はかなり問題なことに,この RCT から非常に恣意的なデータの選択を行っています(▼)。



1行目をご覧いただくと,この試験は n=36 のデータだけ抽出されています。72人の試験だったのに,です。

これはつまり,途中脱落者を除いた「36 人(イベルメクチン群 17人+プラセボ群 19 人)」だけのデータを抽出してメタ解析に投入した,ということです。その上で 85% のリスク減少(RR 0.15;p=0.09)と主張しています。

その結果をどう解釈するか

本来,この試験において「症状残存」という評価項目アウトカムについてまとめると,

7日目時点で

  • イベルメクチン群:22 人中 5 人脱落(転帰不明),0 人 症状残存
  • プラセボ群:23 人中 4 人脱落(転帰不明),3 人 症状残存

ということになります。これ以上でもこれ以下でもありません。

また,この差は統計的に有意ではありません。

にもかかわらず,恣意的に イベルメクチンの 19 人とプラセボ群の 17 人の合計36 人だけを抽出してリスク比を算出し,メタ解析に加える,というのは,統計的にはムチャクチャな行為です。

主要評価項目の臨床的価値

また,そもそも本試験の〈評価項目〉である「7日以内の解熱・咳消失」というものも,臨床現場であまり価値のあるアウトカムとは言えません。

なぜなら,7日目時点で症状消失していなかったプラセボ群側の残り 3人も, 8 日目や 9 日目には全員症状が消失しているかもしれないからです。

その程度の誤差は〈臨床的に有意〉でしょうか?

大切なことは,7 日目(という恣意的なタイミング)で「症状が残っているか」「いないか」ではありません。

実際に何日目、、、、、、で解熱するのか?両群にその「差」はあるのか?そしてその「差」は意味のある差なのか? が大切です。

補足|すこし統計的な話
「症状消失」というアウトカムを,特定の時点で区切ってそこで「達成しているか」「達成していないか」という〈二値変数〉にまとめてしまうことは適切ではありません。症状消失までに要した「日数」という〈連続変数〉同士で比較して,その差がそもそも〈臨床的に有意〉か?その上で〈統計的にも有意〉か?という判断をすべきだ,ということです。ここでいう〈臨床的に有意〉とは,例えば 0.5 日や数時間程度しか変わらないなら臨床的に意味がないということです。それだけのために,わざわざ薬を飲むコストと副作用リスクをかける必要があるのか?私たちはよく考えなければなりません。

要するに本試験は

要するに,この試験の解釈としては

「臨床的意味が乏しいアウトカムで,ほとんど誤差で説明できる程度の差がついた」

だけである,ということです。

くどいようですが,臨床的意味があるアウトカムとは「挿管率」の差や「死亡率」の差などです。この試験の primary outcome の1つである〈ウイルスPCR陰性化〉も,臨床的意味の乏しいアウトカムです。感染性を失った後も暫く PCR 陽性が続くことはすでに知られており,この期間が多少短くなろうが患者さんの予後には寄与しません。重症例や免疫不全者では陽性期間が長いことが知られていますが,これは相関関係であって,PCRが早く陰性になる ➡︎ 重症化を防げるという因果論を示すものでもありません。
PCR陰性化は,あくまで代用エンドポイントであることを理解しなければいきません。本邦でも「発症 10 日& 症状軽快 72 時間経過したらいちいち PCR 再検せず退院で OK」というのがコンセンサスです(COVID-19 診療の手引き 4.1)。この辺りの知識整理は忽那先生の記事がオススメです。

Chaccourらの RCT(@スペイン)



次は 2 行目の試験です。Chaccour らの RCT を見てみましょう。

── C. Chaccour et al. / EClinicalMedicine 00 (2021) 100720

この試験は,COVID-19 発症早期の患者 24 名を対象にした,スペインの極小規模パイロット試験(二重盲検 RCT)です。

12人 vs 12人でイベルメクチンとプラセボ群に割り振っています。

PICOと結果

試験の概要
[P]対象者 PCR陽性で症候性の外来 COVID-19 患者(発症72時間以内)(n=24)
[I]介入 イベルメクチン400μg/kg 単回投与(n=12)
[C]比較対照 プラセボ(n=12)
[O]主要評価項目 投薬 7日経過時点で鼻腔スワブ PCRが陰性化した人の割合
結果 主要アウトカムは両群とも 12/12 陽性,差なし。
特にツッコむまでもなく,何も言えることがない試験です。有意差、、、云々以前に,全くがついていません。サンプルサイズがさすがに小さすぎますので…

ivmmeta.comでの扱い

さて,ivmmeta.com ではこの論文データをどう扱ってメタ解析に組み入れているでしょうか。

記載を見ると,この論文の別添資料(supplementary figure)のデータをウェブサイト作成者らが自ら解析し直したようです。

要するに後付け解析(post-hoc analysis)です。

その上で,〈28 日経過時点での症状残存割合〉がイベルメクチン群 26 %,プラセボ群で 55 % なのでリスク比は 0.47だと主張をしているようです(▼2行目)。



この 26 % と 55 % の計算方法は記載されていないため分かりませんが,そもそも元々 12 人と 12 人ですから,3/12人,6/12人ということでしょうか。

分母が小さすぎて,どう考えても誤差としか思えません。

〈相対表記のマジック〉ですね。

有害事象も

ちなみに,〈相対表記〉を使って言えば,有害事象として消化器症状はイベルメクチン群がプラセボ群の 3.5 倍観測されています(単位は patinet-days)。ただし,息切れは 1/5 に減ったようです(単位は patinet-days)(▼)。

There were no major differences between ivermectin and placebo in the reported patient-days of fever (12 vs 12), general malaise (51 vs 61), headache (34 vs 38), or nasal congestion (91 vs 97). With much lower magnitudes, the ivermectin group reported 3.5-fold more patient-days of gastrointestinal symptoms (21 vs 6) and 5-fold less shortness of breath (3 vs 15) (Fig. S3).

そんな風に表現すると,なんだかとても多かったかのように見えますが,これも〈相対表記マジック〉です。

実際には参加者が 12 人 vs 12 人しかいないので,単位を patient-days にすることで差をかさ増し、、、、して見せていることにご注意ください。

Babalola らの RCT(@ナイジェリア・ラゴス)



続いて 3 行目,Babalola らの試験です。ナイジェリアで行われた二重盲検 RCT です。

この試験は Preprint です。まだ論文になっておらず,十分な査読を受けていません。かなり注意して読む必要があります。

元データはこちら(medriv)。

PICO と結果

試験概要
[P]参加者 COVID-19 PCR 陽性の,軽症または無症候性患者 n=62 人
[I]治療介入 A: イベルメクチン 6mg(n=21)
B: イベルメクチン 12mg(n=21)
[C]比較対照 C: リトナビル+ロピナビル(n=21)
[O]主要評価項目 PCR陰性化までの日数
結果 〈PCR陰性化までの日数〉は,C 群 9.1 ± 5.2 日, A 群は 6.0 ± 2.9 日, B 群は 4.6 ± 3.2日 で有意差あり.用量依存性に効果あり(と主張)
備考 二重盲検。参加者の7割近く男性。年齢は平均 44 才。63人のうち control群が一人脱落して ,21:21:20でアウトカムを比較。

批判的吟味

この論文の中で気になったポイントは,Abstract にも記載されている,著者らの以下の主張です。

IV also tended to increase SPO2 % compared to controls

イベルメクチン群(A群・B群)の方が control 群(C群)よりもSpO2が高くなる傾向、、にあった (※注:有意差はない)

果たしてその結果に意味はあるでしょうか。

この試験開始時の参加者の状態を確認すると,SpO2 平均は A群 97.5%,B群 96.8%,C群 95.8%でスタートしています。そして経過中,実際に酸素吸入を要したのは A群 0/21人,B群 3/21人,C 群 2/21人でした。

つまり,酸素を吸う羽目になった人の数は むしろB群が最多なくらいであり,結局「症状悪化の予防」という肝心のアウトカムを達成できているとはとても言えないのではないでしょうか。

被験者全員の SpO2の平均値が 2 や 3 程度変わったところで,本質的な意味はありません。重要なのは酸素を要する人を一人でも減らすことです。

そもそも,それが「治療」の本質的な目的であって,PCRを陰性化させて喜びたいわけではありません。

PCR 陰性化が多少早かろうが,酸素が必要になる人を減らせていないのであれば,臨床現場にとって何のメリットもないことは明白です。

なおこの試験では一応,主要エンドポイント(ウイルスPCR陰性化までの日数)では有意差を出せていますが,実数を見ると数字のバラツキも大きく,かなり微妙な数字です。A 群は 6.0 ± 2.9 日, B 群は 4.6 ± 3.2日だったことで,「用量依存性に効く」と主張していますが,そもそも酸素が必要な人が「用量依存性に減らせていない」ので,意味のない議論です。

臨床的に意味のあるアウトカムは?

臨床現場では,COVID-19の患者さんに定期的に PCRを行って「やった!陰性になった!」なんてことは誰一人やっていません

くどいようですが,臨床的に大事なアウトカムは

  • 「死亡しないこと」
  • 「挿管・人工呼吸・ICU入室 を回避すること」
  • 「呼吸不全が悪化しないこと(酸素を吸わずに済むこと)」
  • 「症状が早期に消失すること」

です。そして,上からこの順で重要です。

これらのアウトカムで統計的に有意な差が出ないのであれば,本質的な「内服する意義、、、、、、」があるのか疑問です。

ウイルス価だの PCR陽性だのは,本質的なアウトカムではなく,代用アウトカムに過ぎません。

ivmmeta.com での扱い

冒頭にも述べましたが,この試験は,「イベルメクチンによる治療」と「ロピナビル・リトナビルによる治療」の成績を比較した試験です。

もはやコントロール群がプラセボですらない試験です。

しかし,ivmmeta.com では以下(▼)のように,Ahmed や Chaccour らの試験(コントロール群がプラセボ)と統合してメタ解析を行っています。



比較対照コントロールが異なる試験の異なるアウトカムのリスク比を統合して得られる「数字」は何を意味しているのでしょうか。

また,ivmmeta.com の作成者らは,この試験のデータから都合の良いところだけを持ってきて〈発症5日目のウイルス PCR 陽性割合〉という恣意的な評価項目を作り上げ,そのリスク比が 0.36 (95% CI:0.10-1.27)と主張してこのメタ解析に組み込んでいます(ここまでやっても有意差はないわけですが)。

またお得意の〈後付け解析〉post-hoc analysis です。

ここで重要なのは,「5日目」という切り口にした妥当性が不明であるということです。元データを見るに,ここをたとえば発症「7 日目」という切り口にした場合,ほとんど差がないことは明白です。あまりにも恣意的です。

加えて言えば,イベルメクチン 6mg とイベルメクチン 12mgという別アームの参加者(合計40人)を合算してコントロール群(20人)のアウトカムと比較しているのも問題です。

つまり,この表に記載されている リスク比 0.36 (95% CI:0.10-1.27)というものは〈イベルメクチンの 6 mg か 12 mg かよくわからない内服〉と,〈プラセボですらない抗 HIV 薬の内服〉との比較になっています。 結局 何を比較したんだかよく分かりません。

Kirti らの RCT(@インド)

続いて,4 行目の Kirti らの RCT(@インド)をみてみましょう(▼)。



ようやくサンプルサイズが 100 人を超えて,少し結果に対する信頼性が出てきました。

ただし例によって現在 preprint ですので,かなり慎重な解釈を要します。

Ivermectin as a potential treatment for mild to moderate COVID-19 – A double blind randomized placebo-controlled trial Ravikirti, et al. /doi: https://doi.org/10.1101/2021.01.05.21249310

元データはこちら:[medriv] [ivmmetaサイト内の解説]

PICO と結果

試験概要
[P]参加者 18歳以上の軽症〜中等症のCOVID-19入院患者(n=112)
[I]治療介入 イベルメクチン 12 mg(n=55)
[C]比較対照 プラセボ(n=57)
[O]評価項目
  • Primary:6日目時点での RT-PCR 陰性
  • Secondary:6日目時点での無症状,10日目までの退院,ICU入室,挿管,死亡
結果
  • Primary:13/55(23.6%)と18/57(31.6%)で有意差なし(p=0.35)
  • Secondary:すべて有意差なし
備考 二重盲検。シンプルな試験デザインで分かりやすい。

批判的吟味

ここまでの中では,適切なデザインの試験という感じがします。

primary outcome 〈入院6日目の RT-PCR 陰性化割合〉が何ら臨床的意味のないエンドポイントであることは論を待ちませんが,secondary outcome の方は確かに価値ある評価項目だからです。

特に「ICU入室割合」「挿管/人工呼吸となった割合」「死亡者の割合」を比較しており,これらは実臨床で価値のある評価項目です。

ただ残念ながら,この試験は上記の全てで〈有意差〉がついていない negative studyです

論文中ではプラセボ群で 4人/55人 死亡しているのに対し,イベルメクチン群では死亡数が 0人/57人 だったことが強調されています(p=0.12;有意差なし)が,解釈は慎重に行うべきです。

確かに興味深いポイントで,重症化予防効果を期待させますが,サンプルサイズが小さいため〈偶然誤差〉の可能性が十分にあるからです(p=0.12,とはそういうことです)。

検証する価値はある仮説ですから,サンプルサイズを大きくして,死亡や挿管を primary endpoint にした大規模 RCT が待たれるところです。

補足|二次評価項目の限界
  • 本研究では死亡や挿管といった価値あるアウトカムはすべて〈二次評価項目〉です。もし仮にそれらで有意差がついていたとしても,仮説の「提唱」ができるだけにすぎません。〈二次評価項目〉で仮説の「立証」はできないのです。そうやって期待を持って「提唱」された仮説でも,実際に〈主要評価項目〉に据えてより大きいサンプルサイズで検証してみると,結果は「有意差なし」だった ──なんて実例は掃いて捨てるほどあります。
  • 代表例は ELITE 試験ELITE II 試験です。詳細は割愛しますが,ELITE 試験では〈二次評価項目〉に据えられていた「心血管死亡の減少」で有意差がついて非常に期待されたものの,実際に〈主要評価項目〉に据え直してより大規模なサンプルサイズで検証した ELITE II 試験での結果は「有意差なし」でした。

Asghar らの研究(@パキスタン)

次は 5行目(▼)の Asghar らの研究(@パキスタン)です。



100 人対象のオープンラベル試験のようですが,公開されている一次情報源にアクセスできませんでした。

PICOと結果

Clinicaltrials.govへの登録内容より,デザインは以下(▼)

試験概要
[P]参加者 15歳〜65歳の,無症状〜軽症 COVID-19 PCR 確定症例(n=103)
[I]治療介入 イベルメクチン 12mg
[C]比較対照 クロロキン(標準的な投与量)
[O]評価項目
  • Primary:144時間後のPCR陰性化
  • Secondary:挿管/人工呼吸の割合
結果 データにアクセスできず不明。ivmmeta.com 中での記載では,primary outcome に関しては 90% vs 44% (p=0.01)だった様。Secondary outcome の結果はどこにも記載なく不明。
備考 オープンラベル(非盲検)試験。悪性腫瘍,糖尿病,慢性腎不全,肝硬変などの合併症がある患者さんは参加していない。

対照群がクロロキン

論文自体にアクセスできていないので,吟味は困難ですが……
コントロール群がクロロキンという時点で即・解散で良いでしょう。

おそらく試験が行われた当時はクロロキンの有効性があるかもしれないと考えられていた時期なのでしょう。しかし現在,基本的にクロロキンは COVID-19 への使用が推奨されない薬剤となっています。

そのため,日本の現在の標準診療とかけ離れすぎていて(世界的にも標準ではない),ちょっと参考にならない RCT です。

またオープンラベル(非盲検)試験というのも相当バイアスリスクが高いですし,主要評価項目も〈ウイルス PCR 陰性化〉と,臨床的意味のないアウトカムです。

RCT評価項目の〈挿管・人工呼吸〉の方がどうだったのかは若干気になりますが,どこにも記載がなく吟味できませんでした。

補足|普通は使わないクロロキン
  • COVID-19 に対するクロロキンの使用は安全性上の懸念があって,現在基本的には使用を推奨されていません。途中解析で死亡率が高すぎたために早期終了した RCT もあります。──JAMA NetW open. 2020;3(4) e208857. Epub 2020 Apr 24/NCT04323527
  • UpToDate®︎ 上でも “We suggest not using hydroxychloroquine or chloroquine in hospitalized patients given the lack of clear benefit and potential toxicity” とされています(2021.02.06 現在)。

Raad らの RCT(@レバノン)

6行目の Raad らの RCT(@レバノン)は,単盲検の RCT です。



この RCT も元データにはアクセスできませんでした。
情報源は ivmmeta.com 上と,中国臨床試験データベースへの登録内容のみです。

PICOと結果

試験概要
[P]参加者 COVID-19 PCR陽性の成人 (inclusion期間に無症候性)
[I]治療介入 イベルメクチン(体重 45 kg 〜 64 kgの場合 9mg,65〜84kgの場合 12mg,85kg以上の場合は 150μg/kg )
[C]比較対照 プラセボ
[O]主要評価項目 ウイルス価(何日時点のものかデータベースには記載なし)
結果 不明
備考 当初は 30人 vs 30人 での試験で予定されたようです。が,最終的にはなぜか 50人 vs 50人まで増やして行われたよう

批判的吟味

一次情報源にアクセスできていませんので,ivmmeta.com 上の記載を鵜呑みにするしかありませんが,〈3日目時点のウイルス価〉はリスク比 0.41,p=0.01 と有意差がついたようです。

しかし〈ウイルス価〉が減ったからといって患者さんの症状が良くなったか悪くなったか不明で,その2つの関係性も不明です。臨床的意義は乏しいと考えられます。

実際〈後付け解析〉と思われる「入院」というアウトカムでは,有意差がついていません。治療群 0/50 vs 3/50 と,治療群の方がわずかに入院が少ない傾向があったようですが,サンプルサイズが小さいため〈偶然誤差〉の可能性が拭えません(p=0.24)。

また,この試験は〈単盲検〉です。

つまり患者さんにはプラセボか真薬どちらが投与されたか知らされませんが,医者や研究者・イベント評価者には筒抜け,というデザインです。解析やアウトカムの報告などの段階で恣意的な〈調整〉が入り込むリスクが高く,バイアスリスクは高く見積もられます。

結果はかなり割り引いて読まなければなりません。

さらに言えば「入院」はソフトエンドポイントですので,単盲検の RCT(医者や評価者には治療群かどうか筒抜け)の試験との相性は特に最悪です。恣意的な基準で入院判断が行われる恐れがあります。イベルメクチンに有利な結果に歪めることは容易であり,読者は相当割り引いてデータを読まなければなりません。

以上 6 試験を統合する意味は?

以上,ここまで〈Early treatment〉として統合(▼)されている 6 つの RCT を見てきました。



どの試験も,もともとサンプルサイズが小さ過ぎて信頼性が低い上,ivmmeta.com 自体が極めてバイアスリスクの高い〈後付け解析〉をしています。

また,どれも本来の〈主要評価項目〉ではないアウトカムをピックアップして上表にまとめており,そのムチャクチャっぷりには若干の恐怖すら感じます。

そもそも,コントロール群も用法用量も〈評価項目アウトカム〉すらもバラバラなこれらの試験(▼)が〈統合〉できるわけがありません。

  1. Ahmed らの RCT :プラセボと〈7日目時点の症状残存〉を比較
  2. Chaccour らの RCT :プラセボと〈28日時点の症状残存〉を比較
  3. Babalola らの RCT :抗 HIV 薬と〈5日時点での PCR 陽性〉を比較
  4. Kirti らの RCT:プラセボと〈総死亡〉を比較
  5. Asghar らの RCT:クロロキンと〈7日目時点での PCR 陽性〉を比較
  6. Raad らの RCT:プラセボと〈入院〉を比較
注)① 以外全て元試験の主要評価項目ではなく〈後付け評価項目〉

しかし ivmmeta.com では

最下段: 432 patients   RR 0.29 [0.16-0.53]

などと記載し,強調してしまっています。

この数字が意味するものは「何の」「何に対する」「どんな」リスクの比なのでしょうか? 数字遊びのデータをそれらしく呈示するのはやめていただきたいです。

現在進行中の日本の RCT

実は,日本でもイベルメクチンの RCT が現在進められています。

北里大学のチームが中心になって進めている医師主導治験で,現在(2021.02.06 時点)も recruit 中のよう。「CORVETTE-01」という略称のようです。

[jRCT: 2031200120](英語)[jRCT: 2031200120](日本語)

完全に余談ですが,この jRCT なる日本の RCT データベース,なぜか日本語版のページの方が読み辛く,英語版の頁の方がシンプルに整理されています。日本語版の頁は,何度か〈+〉マークをポチポチしないと肝心の試験デザインが見れません。フォーマットを変えていただきたいですね…

では早速,今まで見てきた RCT たちと試験デザインと見比べてみましょう。

この試験の PICO

試験概要
[P]参加者 COVID-19 PCR 陽性と診断され 3日以内の 20歳以上成人(n=240 目標)
[I]治療介入 イベルメクチン 200μg/kg 単回投与
[C]比較対照 プラセボ 単回投与
[O]評価項目
  • Primary:PCRが陰性化するまでの日数
  • Secondary 1:独自の順序尺度(※)による症状悪化
  • Secondary 2:ECOG Performance Status の悪化
結果 現在進行中
※ひとまず R3.3.31 までは recruit 期間が見込まれているよう
備考 室内気 SpO2≧ 95 %,40 kg以上,が参加要件
:独自の順序尺度(※)の中身
7点順序尺度による評価
  1. 肺炎なし,日常生活動作に制限なし(PS0)
  2. 肺炎なし,日常生活動作に制限あり(PS1以上)
  3. 肺炎あり,酸素吸入なし
  4. 肺炎あり,酸素吸入あり
  5. 非侵襲的補助換気療法または高流量酸素吸入療法あり
  6. 人工呼吸管理あり(ECMO使用も含む)
  7. 死亡
1日目〜15日目に病状が “悪化” した症例の出現率を評価。”悪化” とは,〈①からの 2段階以上の変化〉および〈②または③ から1段階以上の変化〉を指す。
まさしく本項で見てきた〈Early Treatment〉な試験デザインです。

期待と私見

これまで見てきた RCT と比べたら,サンプルサイズも(まだ recruit 中ですが)240 と多く,結果の信頼性は高くなりそうです。

待望の日本発治験なので応援したいですね。

ただ,やはり正直〈評価項目アウトカム〉の設計がシブいですね……もちろん色々な事情があってこういうデザインになったのかとは思いますが。

Primary outcome が 例によって臨床現場に生きない〈PCR陰性化までの日数短縮〉になっていることは残念です。

繰り返しになりますが……臨床現場では患者さんに繰り返し PCR を行って「まだ陽性だ!残念!」なんてこと誰もやっていません。退院基準も発症10日 & 症状軽快 72 時間でOKで,「PCR陰性確認」は不要です。軽症例であれば仮に PCR 陽性でも 10 日経過時点でほとんど感染性がないことが知られているからです(忽那先生のわかりやすい解説記事)。つまり,PCRが陰性化するタイミングを追いかけたところで,臨床現場にとっての意義はありません。特に本試験に組み入れられる「自宅待機するような軽症」の方にとっては尚更,意義が乏しいアウトカムだと考えられます。

臨床現場からしたら,シンプルに〈酸素投与が必要〉〈挿管が必要〉〈死亡〉など意義ある〈評価指標〉が本当に減るのかどうかが知りたいのです。

この試験では〈二次評価項目〉にそのあたりの評価が含まれるものと思いますが,あくまで〈二次評価項目〉ですから,仮説の〈立証〉はできません。

また,独自の「7点順序尺度による悪化評価」というのも,なかなか臨床医にとって結果の解釈が難しくなってしまう印象です。

特に「② 肺炎なし,日常生活動作に制限あり」と「③ 肺炎あり,酸素吸入なし」を臨床現場で厳密に区別することはおそらくあまりないので,過剰なイベント加算になる可能性があると感じます。また,今回に限らず PS や mRS や MMSE などの順序尺度をアウトカムにした全 RCT に言えることですが「1点の悪化」の価値が均等ではないので,結果の解釈が難しくなるという難点があります。

もちろん「何かしら有意差を出さなければ先に進めない」といった業界の事情や色々な思惑があってのこの〈二次評価項目〉なのだろうとは察せられます。

第 II 相試験と明記されていますので,まずは〈二次評価項目〉の方で感触を確かめて,良ければさらに規模を大きくした第 III 相試験を行う,ということなのかなと思います。

承認はいつ頃?

SNS 上では

# 厚労省はイベルメクチンを承認してください

みたいなハッシュタグも流行している様ですが,この試験デザインを見る限り,〈承認〉はまだまだ先,という印象ですね。

この試験は Recruit 期間も 3月31日まで検討されている様ですし,そこから結果解析して発表となると,5月は越えるでしょうか。さらに,第 II 相かつ〈主要評価項目〉が〈PCR陰性化〉という微妙な設計であることを考えると・・まだまだ先でしょう。

重症化予防や死亡抑制といった「臨床的な有効性」をキッチリ示した二重盲検プラセボ比較 RCT はこれまで1つもないですし,この試験もそういう設計ではありませんので,普通の手順、、、、、で考えたら〈承認〉なんて先のまた先です。

なお,実際には何パターンか特殊な〈緊急承認手順〉もあるため,それについては別記事で述べたいと思います(※ 私自身は慎重な立場です)。

まずは本邦の RCT 結果を座して待ちましょう。

まとめ

ivmmeta.com で紹介されている〈Early treatment〉(=軽症・早期例対象)のランダム化比較試験 RCT を 6 つご紹介しました。

どれもサンプルサイズが小さいため信頼性が低く,検証仮説も〈PCR が陰性化するかどうか〉というアウトカムをみたものばかりでした。

臨床現場で本当に価値ある〈有効性〉── 死亡率低下や挿管回避など ── 全く検証されていない,というのが実態の様です。

これらを〈主要評価項目〉にした試験がない,ということです。

まだまだ仮説〈提唱〉のレベルであり,仮説〈検証〉のための十分なサンプルサイズの臨床試験(第 III 相試験)が待たれます。

期待があるのは事実

なお,新型コロナ軽症早期例 vs イベルメクチンについては,ここまで示してきた内容が「現実」ですが,イベルメクチンに確かな期待があるのは事実です。

最近 Chest に載った米国フロリダ州での後ろ向き試験(Propensity score match)などは興味深かったです。軽症早期例を対象としたものではありませんが,死亡というハードエンドポイントで有意差がついており,効果を期待させます。しかしあくまで後ろ向き試験であり(Propensity score match とはいえ)解釈が難しいため,ここでは扱いません。[Chest. 2021 Jan; 159(1): 85–92]

イベルメクチンによる死亡率低下は,二重盲検 RCT できちんと検証していただきたい仮説だと思っています。

推奨書籍

全医療職・全 EBMer に買って配りたい名著のリンクを下に貼っておきます。これらの書籍を読破するといわゆる〈批判的吟味〉のハウツーが得られますが,代償として「この世の医学研究結果のほとんどが,原著を読むまで信じられなくなる」という重い十字架を背負うことになります。Amen.

Users’ Guides to the Medical Literature


タイトル通り「医学論文を現場でどう応用するか?」迷える臨床家のためのユーザーズガイド。Tips 集のような構成で,どこからでもつまみ読みできます(通読向きではない)。医学論文の批判的吟味を学ぶにあたり 1 冊だけ選ぶならコレ,という極めて網羅性の高い一冊です。著者 Gordon Guyatt 氏は “EBM” という言葉を作った張本人。分厚い本ですが,気軽に持ち歩ける Kindle 版はオススメです。邦訳版もあります。


医学文献ユーザーズガイド 第3版


表紙が全然違いますが「Users’ Guides to the Medical Literature (JAMA)」の邦訳版。医学文献を批判的吟味するためのTips集としてかなりの網羅性を誇る代表的な一冊です。唯一の欠点は Kindle版がないこと(英語版はある)と,和訳が気になる部分が結構あること。2つでした。原著とセットで手に入れると最強の気分を味わえます。鈍器としても使えます

[おすすめ本紹介]

Users’ Guides to the Medical Literature


タイトル通り「医学論文を現場でどう応用するか?」迷える臨床家のためのユーザーズガイド。Tips 集のような構成で,どこからでもつまみ読みできます(通読向きではない)。医学論文の批判的吟味を学ぶにあたり 1 冊だけ選ぶならコレ,という極めて網羅性の高い一冊です。著者 Gordon Guyatt 氏は “EBM” という言葉を作った張本人。分厚い本ですが,気軽に持ち歩ける Kindle 版はオススメです。邦訳版もあります。

医学文献ユーザーズガイド 第3版


表紙が全然違いますが「Users’ Guides to the Medical Literature (JAMA)」の邦訳版。医学文献を批判的吟味するためのTips集としてかなりの網羅性を誇る代表的な一冊です。唯一の欠点は Kindle版がないこと(英語版はある)と,和訳が気になる部分が結構あること。2つでした。原著とセットで手に入れると最強の気分を味わえます。鈍器としても使えます

─ ads ─
>医療統計の解説チャンネル

医療統計の解説チャンネル

スキマ時間で「まるきりゼロから」医療統計の基本事項を解説していく Youtube チャンネルを 2 人で共同運営しています。

CTR IMG