この記事は 2021 年 6 月時点のデータを元に作成したものです 2021 年 6 月 7 日,FDAによってアデュカヌマブという新しい「アミロイドβプラーク減少薬、、、、、、、、、、、、、」が承認(※条件付きの迅速承認)されました。 […]
前回の記事で「アミロイドβ削減薬」として FDA に「条件付き早期承認」された新薬アデュカヌマブの問題を端的に 12 個取り上げ,紹介させていただきました(▼)。
- 治験は「無益性」のため途中撤退していた
- 後付け解析で異例の承認申請
- 類似機序の薬剤は軒並み治験撤退
- 効果は限定的(1年半で CDR 0.4 点分の “減速”)
- 脳内のアミロイドプラークは減るがその「臨床的意義」は不明
- 治療対象者は軽症早期に限定
- 重大な安全性の懸念:脳内の浮腫・出血・鉄沈着
- FDA の外部諮問委は 11人中10人が承認反対
- あくまで「条件付き早期承認」
- 追加の RCT によっては「承認取り消し」も
- 薬価は年間 56000ドル(約610万円)と高額
- 日本での適応は(普通に考えれば)難しい
前回は一覧性を高めるため,あえて個々の内容の詳述を避けました。そのため背景知識がない方には少しわかりづらい記事になってしまっていたと思います。
そこで今回からは,上記の個別の問題について「具体的に何がどう問題なのか」という点について私見を述べます。
この記事では上記 12 の問題のうち,とくに ①〜③ の問題について考えてみます。
- 治験は「無益性」のため途中撤退していた
- 後付け解析で異例の承認申請
- 類似機序の薬剤は軒並み治験撤退
アデュカヌマブとは
アルツハイマー病患者さんの脳細胞内には,糸屑のような,あるいは「プラスチックゴミ」のようなものが多く溜まっていることが昔から分かっています。
この糸屑ゴミのことを〈アミロイドβ〉と呼びます。
これが「脳の障害の成れの果てを見ているだけ」なのか「脳の障害の原因になっている」のか(=アミロイドβ原因仮説),というのは以前から議論が絶えず,十分な検証はできていません。
これまで種々の議論がありつつも,アルツハイマー病の病態はホンネのところでは実際多くのことがわかっていないのが現状です。
アミロイドβを除去する薬
アデュカヌマブ aducanumab は,このアミロイドβを標的とした抗体(モノクローナル抗体:mab)です。
投与することで,このアミロイドβを除去してくれる効果が期待されています。
こうした機序での創薬は新しく,アデュカヌマブをはじめとする複数の薬剤(※後述)が,アルツハイマー病の臨床症状の悪化を効果的に抑制する「可能性がある」と言うことで期待されていた経緯があります。
特にアデュカヌマブの第Ⅰ相試験(Ib試験)の注目度は非常に高く,その試験 PRIME : NCT01677572は Nature という基礎医学系の一流紙に掲載されたほどです。
しかしその後の経過は,前回の記事で記載した通りです。
- 治験は「無益性」のため途中撤退
- その後付け解析で異例の承認申請
- 類似機序の薬剤も軒並み治験撤退
と,非常に厳しい展開になりました。
治験は無益性のため途中中断
2014 年頃からは,類似機序の薬剤の治験ラッシュでした。
アデュカヌマブも「本当に効くのか?」という〈検証〉のため,治験が行われることになりました。
これが 2 つの第 III 相試験(二重盲検 ランダム化比較試験 RCT),EMERGE と ENGAGE でした。
- 補足|第 I 相・II 相・III 相の違い
2つの臨床試験
EMERGE と ENGAGE は,被験者総数 3210 名に及ぶ第 III 相試験です。2015 年ごろから並行して進められました。
軽症早期例に限って,またアミロイド PET という画像検査で「実際に脳内にアミロイドβが蓄積していそう」という所見が得られた症例のみに限って行った治験です。
きっとアデュカヌマブが〈アミロイドβ〉プラークを除去して,認知症の進行をとどめてくれるだろう
という期待がありました。
無益性のため撤退
しかしこれら二つの試験は,2019年 3月,〈無益性解析〉 futility analysis の結果,中止されています。
途中まで集められた 1748 人(予定の半分超)のデータをもとに中間解析が行われ
このまま続けても勝ち目はないだろう
という見込みとなったからです。
- |無益性解析とは
-
- 〈無益性解析〉futility analysis は,いわゆる〈中間解析〉interim analysis の一種で,ひとことで言えば「失敗保険」です。試験途中の時点でデータを一度解析してしまって,「このまま治験を続けても統計学的な有意差を示せず,無意味となるだろう」と考えられる時,早い段階で試験を中止してしまえるというものです。
- 明らかに敗色濃厚な臨床試験をいつまでも続けていても,無駄な薬剤のために患者さんを長期拘束するばかりでなく,経済的負担も製薬会社にのしかかるばかりで,誰にとってもメリットがありません。そのため途中終了することも「合理的」とみなされる場合があります。
- 通常は,その後にいかなる〈後付け解析 post-hoc analysis〉を行なったところで,結論が覆ることはありません
治験失敗まではよくある話
実は,ここまでの流れ自体は,さほど珍しいことではありません。
基礎研究や第 II 相レベルまでは効果が期待されていたものの,実際にそれなりの規模で第 III 相試験を行ったら,残念ながら結果は全然 ── そんな薬剤はこれまでも掃いて捨てるほどあります。
それほどに創薬は難しく,コストがかかるものです。
「後付け解析」で有効性を主張
話がおかしくなってくるのはここからです。
スポンサーは試験を途中中断したにもかかわらず,その後のデータ解析をおこなった後,一転して有効性を主張しはじめたのでした。
── Answers news
〈無益性解析 futility analysis〉の時点では含まれていなかった参加者(無益性解析がおこなわれた 2019年12月26日〜治験中止発表の2020年3月21日までの参加者)を加えたデータで再度結果を解析し直したところ,EMERGE 試験の方は主要評価項目を達成した,というのです。
それでも ENGAGE試験 の方では主要評価項目を達成できなかったわけですが,
ENGAGE試験 の方でも,各グループで高容量のものだけをみれば,効果が出ている!
ということを主張したのでした。
野球でたとえると
創薬のステップになじみのない方からすると,こうした動きがどの程度「普通でない」ものであるか,わかりづらいかもしれません。
これは野球でたとえてみると,5回 ウラまで戦った段階で
これは勝ち目ないですわ。降参します!ありがとうございました!
と言って試合を途中棄権した後から
いやあ〜実は,途中から投入した一軍の成績だけでみればヒット数が多かったんですよねえ
などと主張しはじめたようなものです。
後付け解析でも有意差がつかなかった ENGAGE に関しても,
早い段階で降参してしまいましたけど,本当はあのまま続けてたら勝ってたと思うんですよね。序盤は本調子じゃなかったんですよ。まだ あそこから一軍投入するところでしたからねえ。最初から一軍のメンバーだけで試合をしていれば,多分ウチが勝ってましたね。
と,そんな主張をしているイメージです。
- 補足|非常に複雑な内情
-
- 実は,EMERGE/ENGAGE は治験中に何度も投与量に関するプロトコル変更が行われています。これは有害事象である「アミロイド関連画像異常 ARIA」に対する認識が,治験中に変わっていったことが原因です。ARIA は当初「危ない」ものとして警戒されており,薬剤投与量も少なめに設定されていたのですが,治験の途中から「多くは無症候性」ということがわかってきたため「恐れずどんどん薬剤投与量を増やしていこう」という方向性に変わっていったのでした。そこで,特にプロトコルバージョン4(PV4)以降は,高容量投与となる対象者が増やされていきました。
- ところが,こうしたプロトコル変更があった中でも,無益性解析は当初の予定通りの日程で行われました。結果,治験は途中終了となったのですが,後になって製薬会社は「PV4 以降の症例はどうやら成績が良い」ということを主張し始めたのでした。そして,EMERGE と ENGAGE で相反する結果になったことについて「EMERGE よりも ENGAGE の方が治験の開始や進行が早かったため,PV 4 以降にリクルートされた患者さんの割合が小さくなってしまったためだ」という仮説を立てました。
- 要するにスポンサーは「高容量投与された人が増えたからこそ EMERGE は ENGAGE より良い結果になった」ということを主張したわけです。そして「高容量曝露群に限れば ENGAGE でも結果がよい」「用量依存性に効果がある」という論理展開をしたのでした。
- なおこの仮説には反論があり,単にプラセボ群の成績に差があった(ENGAGEのほうがプラセボ群の成績がよかったから差がつきにくかった)だけでは? と指摘する論文が,2020 年 11月には電子先行掲載されていました。
Alzheimers Dement. 2021;17(4):696-701. [PMID: 33135381]
類似薬剤は軒並み治験撤退
ここで問題となるのが,他の類似薬剤との整合性です。
他のAβ標的薬との整合性
先述した様に,アミロイドβ(Aβ)を治療標的とした薬は,アデュカヌマブだけではありません。
同時期に,類似薬が多く開発され,実際に治験もおこなわれてきた経緯があります。
しかし,そのほとんどが,ことごとく途中撤退,ないし「偽薬と統計学的有意差なし」という結論となり惨敗しています(▼)。
薬 | 機序 | 動向 |
---|---|---|
クレネズマブ | 抗Aβモノクローナル抗体 | (ロシュ社)第 III 相 RCT:無益性のため,途中で中止。論文は publish されず。 CREAD 1 CREAD 2 詳細報道 |
バピヌズマブ | 抗Aβモノクローナル抗体 | (ファイザー & JnJ社)第 III 相 RCT:主要評価項目は有意差なし ── ADAS-cog11と,認知症のための障害評価票(DAD)のスコア。NEJM論文邦訳 |
ソラネズマブ | 抗Aβモノクローナル抗体 | (イーラ─リリー社)第 III 相RCTで有意差なし:主要評価項目は ADAS-cog11スコア。NEJM論文邦訳 |
ガンテネルマブ | 抗Aβモノクローナル抗体 | (ロシュ社)第 III 相 RCT:無益性のため途中中断。主要評価項目は CDR-SB のベースラインから 104 週までの変化量。 PMID:29221491 |
ベルベセスタット | 経口 βサイトアミロイド前駆体タンパク質切断酵素(BACE)阻害剤 | (メルク MSD 社)第 III 相 RCT:無益性のため途中中断。主要評価項目は CDR-SB のベースラインから 104 週までの変化量。NEJM論文邦訳 |
- |各種スコアの補足
-
- CDR-SB:6 項目の認知症スケール。各項目 0-0.5-1-2-3 の 5 段階,合計 0~18 のスコア。スコアが高いほど認知機能と日常生活機能が不良であることを示す。アデュカヌマブの 2 つの治験である EMERGE,ENGAGE の主要評価項目もコレ。
- ADAS-cog11:11 項目の認知機能下位尺度。0~70 で,スコアが高いほど障害が大きいことを示す。
- DAD:0~100 で,スコアが高いほど障害が小さいことを示す
なぜか単独勝利のアデュカヌマブ
これだけの惨敗試験が続く中で,アデュカヌマブだけが「単独勝利扱い」となるのは,いささか奇妙な様に思われます。
これらの薬剤は,全て同じ仮説──アミロイドβを治療標的とすれば認知症の進行を遅らせられるという仮説──に基づいて,同じ標的を対象としたもののはずです。
にもかかわらず,他の新規薬は全て効果を十分に示すことができず,アデュカヌマブの「独り勝ち」などということがありうるのでしょうか。
他の薬剤との整合性を素直に考えたら,アデュカヌマブの方がむしろ何かおかしいのではないか,αエラーなのではないか,と勘繰られてもおかしくありません。
- 補足|αエラー
- 本当は「ない」差を「ある」といってしまう間違い。5%の有意水準で「統計学的に有意」という判断を行うとき,5%のαエラーを許容するということになる。そして,仮説検定を何度も行えば行うほど,つまり〈後付け解析〉を繰り返し行えば行うほど,その内のどこかで α エラーを犯すリスクは高まっていく(=多重検定の問題)。
この記事では 〈αエラー〉と〈βエラー〉とは何なのか? ということについて,基本的内容に絞ってまとめます。 さらりと解説されて終わってしまうことが多い概念ですが,その本質的な部分をしっかり理解しておかないと,研究結果の解釈に大きな誤解[…]
そもそも失敗試験
事実,アデュカヌマブの RCT(EMERGE & ENGAGE)も,本来は「失敗試験」でした。
途中の無益性解析で「無益」だと判定されたから撤退しているわけであって,本来アデュカヌマブも他の薬と同様に「負け」ていたはずです。
それを後になってから急に
実は EMERGE は勝ってました!
そして ENGAGE も高容量曝露症例に限れば勝ってました!
と〈後出しジャンケン〉をしたに過ぎません。
これでは真面目に第 III 相試験を行い,そして散っていた他社に対しても失礼という感じがしてしまいます。
第 III 相試験の意味
〈後付け解析〉であることに目を瞑っても,2 つの RCT の結果が相反していることは問題です。
結局のところ,アデュカヌマブの治験での成績は「後出しジャンケンでも一勝一敗」であるわけです。
当然ながら,本当にもっとたくさんの患者さんに投与した時,「EMERGE 試験の結果(=主要評価を達成した方の結果)が再現されるかどうか」わかりません。
いずれにしても,
ENGAGE は高用量曝露群に限って言えば結果はよかった
と主張するのであれば,本来,高用量群だけに限って再度の大規模 RCT をやり直すべきです。
その薬は本当に意味があるのか?
「本当に臨床的効果が期待できるのか?」という〈検証〉は,創薬における最重要な部分です。
当然それは,第 III 相試験(市販前 RCT)として行われるべきものです(▼)。
しかし,FDA は今回,第 III 相試験の結果が十分でない(認知機能スケールを維持できると示せなかった)にもかかわらず,条件付きで〈迅速承認〉accelerated approval を行いました。
承認の「条件」としては 第 IV 相試験(市販後 RCT)の実施が義務づけられています。その RCT で十分な効果が示されなければ,承認取り消しとなることが明記されました。
「効くかどうかは市販後に確認」でよいのか?
結局これは「本当に意味がある薬なのか?」という,本来は第 III 相試験の段階で白黒つけておくべき最重要な検証プロセスを 市販後の調査(第 IV 相試験)に棚上げしてしまった,ということです。
当然ながらこれは,かなりリスクの高い行為であると言わざるを得ません(▼)。
第 IV 相の結果が出るまでの間にも,リアルワールドでは無数の患者さんに実際に薬剤投与がされてしまうことでしょう。益も害も不透明であるにもかかわらず,です。
これでは結局,リアルワールドの患者さんを対象に人体実験をおこなうことと同義です。
満たされない医療ニーズ
アデュカヌマブの承認までの流れは結局,
- 途中中止された治験の後付け解析
- それでも主要評価項目は1勝1敗
- そこには目を瞑り,2ヒット(*) したから市販許可
という形で行われており,そこまでするのか?!と言いたくなるような 力技でのゴリ押し承認 です。
2020年11月に行われた外部諮問委の意見聴取でも,11 人中 10 人が承認に大して否定的な立場をとっていました。にもかかわらずこのような裏技のような承認手続きが取られたことには,非難の声もあります。
2021年6月12日(日経新聞)
アルツハイマー型認知症に現状治療法がないことは確かに克服されるべき現実であり,一刻も早い「本当に効く新薬」の開発が待望されていることは事実です。
FDA も 公式ウェブサイトにおいて,今回の決定が “an unmet medical need”(長年にわたり満たされていないアルチハイマー治療という医療ニーズ) を加味したものであることを明記しています。
しかし今回の決定は「アルツハイマー型認知症を克服する」という最終目標に対し,本当にプラスと言えるものだったのでしょうか?
これほど多くの罹患者がいる疾患を相手にしているからこそ,感情的議論に陥ることなく,厳密な科学的議論をおこなうことが重要だと感じます。
- |リスクと利益の天秤も…
- アデュカヌマブの効果は,都合のよい結果が出た EMERGE 試験の中でもさらに high dose 群のみに限って,ようやく CDR-SB 0.4 点程度の差です。それも,プラセボ群が 1.74 点悪化するのに対し,アデュカヌマブ群が 1.35 点の悪化で済んだという程度のもの(78週時点)です。CDR-SB は 0.5 点ないし 1点刻みの指標(18点満点)であり,こうして 0.4 点程度「悪化をゆるやかにする」ことが臨床的にどの程度 の益と言えるでしょうか。そしてその益は,3人に1人 脳内浮腫や脳内微小出血や脳内鉄沈着を起こすというリスクに見合ったものなのかも,よく検討することが必要です。また,今後長期的に継続した場合(=脳内微小出血や脳内鉄沈着などが蓄積していった場合)に risk/benefit バランスはどうなっていくのか,現時点では不明です。
まとめ
今回は以上です!
前回の記事でとりあげたアデュカヌマブが抱える現実的問題12個の中から,特に以下の3つの問題について取り上げました。
- 治験は「無益性」のため途中撤退していた
- 後付け解析で異例の承認申請
- 類似機序の薬剤は軒並み治験撤退
また,後半では第 III 相試験の結果から「アミロイドPETの画像所見はよかった」という部分だけを切り出して〈迅速承認〉した FDA の決定に対する懸念を述べました。
次回は「効かないかもしれないクスリ」が承認され市中に普及することで生じる諸問題について,まとめてみたいと思います。
この記事は 2021 年 6 月時点のデータを元に作成したものです [sitecard subtitle=前回の内容 url=/med/aducanumab/] 前回の記事で「アミロイドβ削減薬」として米国 FDA に「条件付き早期承認[…]