【告知】ソフトエンドポイント・ハードエンドポイントの解説動画を公開

告知

毎度のことながら告知が大変遅れてしまいましたが,医療統計の解説動画を Youtube に up しました。

今回のテーマは

ソフトエンドポイント・ハードエンドポイントとは何か?

です。

ソフトエンドポイント

結論から言ってしまいますと,この動画の要旨は以下の表の通りです。

ソフトエンドポイント ハードエンドポイント
定義があいまい 定義が明確
主観的指標 客観的指標
一般化しにくい 一般化しやすい
こまかい変化 大きな変化
臨床試験で観測しやすい 臨床試験で観測しにくい
Ex. 自学症状,全般改善度 Ex. 死亡,心血管イベント発症

ソフト × 非盲検の危険性

この動画で特に強調したかった点は,

主観的・印象論的な指標(=ソフトエンドポイント)を使うことの限界

──要するに「認知的なバイアス」に非常に影響されやすいという問題です。

プラセボ効果やホーソン効果,ピグマリオン効果など,なんらか「心理的な期待」が効果を過剰に見せてしまうことを防ぐため,ソフトエンドポイントの試験では盲検化 maskingが極めて重要になるのでした。

またこれは PROBE 法についても同様に言えることです。「現場は全く盲検化されていない」という限界を,論文読者側はよく理解しておかなければなりません。

とにかく

ソフトエンドポイント×非盲検 = バイアスリスク大

ということですね。

なお PROBE と言うとディオバン事件が記憶に新しく,なんとなく悪いイメージがついてしまっていますが,リハビリ手法の研究などでは有用な手法だと思います。大切なのはデザインの限界をきちんと理解することです。
─ ads ─

ソフトエンドポイントの定量性

また今回,動画の中で「全般改善度 CGI」を大きく取り上げました。

全般改善度とは「ぱっと見の印象で良くなったか悪くなったか」という曖昧な感覚を数字に落とし込んだものです。7 段階評価のスケールで「著明改善・改善・やや改善・不変・やや悪化・悪化・著明悪化」とするものが広く使われています(5段階評価の場合もあります)。

しかし,ここで

「やや改善」以上であった人の割合が,新薬群 32% vs プラセボ群 21%!統計学的に有意!

などと言われても,定量性の観点で疑問が残ります。

「改善以上」とは具体的にどの程度、、、、よくなったというのでしょうか?全くイメージができません。

またそもそもベースラインの重症度がうまくランダム割り付けできていなかったとしたら,重大なバイアスになってしまいます。

たとえば脳卒中は急性期リハビリだけでも症状が一定程度改善します。ですから脳卒中の試験で全般改善度を評価指標にした際,割り付け時点の重症度に偏りがあってはなりません。もし新薬群の方に重症例が多く割り付けされてしまったら,「自然経過による改善」を過剰に「改善した!」と解釈してしまうリスクがあります。もちろんランダム化比較試験であれば本来ベースラインの重症度はバランス良く割り付けられるはずですが,サンプルサイズが小さい場合はその限りではありません。大きく偏った割り付けになってしまう可能性があり,その場合は補正解析が必要となるはずです。

本邦のローカルドラッグに注意

1990 年代以前の日本の神経系の薬剤は,特にこの「全般改善度 CGI」を評価指標としたものが散見されます(この場で具体的な薬剤名を挙げることは控えます)。そして残念ながら多くの場合,割り付け時の重症度の偏りなど重大なバイアスの補正もされることなく承認されています。

「現在の基準では承認されなかったであろう薬剤」たちが,現在の臨床現場においても多く使用されているのです。その種の薬剤は本邦のガイドラインでは一定程度推奨されていることがありますが,完全なローカルドラッグで,海外のガイドラインや UpToDate には一切登場しません。

そうした問題意識もあって,今回の動画での論文具体例として,全般改善度を取り上げさせて頂きました。

なお本邦の薬剤添付文書には必ず「承認理由となった第 III 相試験」の簡潔なデータが付記されています。処方薬剤の第 III 相試験の原著を隅々読むことが難しくとも,最低限,添付文書の内容くらいは目を通すことが一般的になってほしいと思います。

ハードエンドポイントにも限界はある

しかし,全ての臨床試験をハードエンドポイントにすれば良いかと言えば,そうでもありません。ハードエンドポイント(死亡・心血管イベントなど)にも欠点はあります。

具体的には,

  • 重大イベントが起きる前の細かな変化を検出できない
  • 重大イベントが少なく差を検出しにくい(大規模試験やハイリスク例だけに限った試験が必要)

といった問題が挙げられます。

また,そもそもソフトかハードかというのは綺麗に二分される概念ではなく,グラデーションを持って分布するものです(▼)。

ソフトとハード

今回の動画ではこうした内容を具体例とアニメーションをふんだんに取り入れてご紹介していますので,ぜひ本編をご覧いただければと思います。

動画の構成

なお動画の構成は以下の通りです。

動画の構成
  • 00:24|今回の結論
  • 01:06|全般改善度(CGI)とは
  • 02:14|ハード/ソフトエンドポイントの意味
  • 02:31|ハードエンドポイントの例・欠点
  • 04:29|ソフトエンドポイントの例・欠点
  • 06:26|臨床試験における注意点
  • 08:09|盲検化がない場合の注意点
  • 10:27|ソフトエンドポイント×PROBE法の注意点
  • 11:11|盲検できない介入
  • 13:12|実際の論文の例
  • 17:51|まとめ

合計18分程度ですが,1.5倍速〜 2倍速で見ていただく前提で作成しています。
つまり 9〜12 分程度でざっくり概要を抑えられるお得な動画となっております!😊

次回予告

今後も引き続き

シリーズ「RCTを吟味する」

と題して動画を投稿していきます。当面はアウトカムに関する部分に着目し以下(▼)の内容を複数回に分けて構成し直していく予定です。

合わせて読みたい

この記事では,「医学系 RCT を正しく読む」ための必須知識となる,エンドポイントの種類についてまとめます。 エンドポイントの種類まとめ 真のエンドポイントと代用エンドポイント ハードエンドポイントとソフトエンドポイント 主要エンドポイ[…]

次回は primary endpoint,secondary endpoint について取り上げる予定です。またチェックしていただけたら嬉しいです。よろしくお願いします!

※)その前にαエラー・βエラーや power analysis の短い動画を作るかもしれません

余談

尚,二人体制で進めてきたこのYoutube チャンネルですが,今回が記念すべき10 本目の動画でした!👏

いや少な!というツッコミが聞こえてきそうですが,ええ,自覚しております…… これでもまあまあのリソース(1本あたり二人で20〜30時間程度)割いて進めているのですが,なかなか難しいものですね。

とはいえあまり雑な内容にもしたくありませんし,ゆっくり一歩ずつ進めていきたいと思います。

チャンネル登録も是非!よろしくお願いいたします 🙇‍♂️🙇‍♀️

※共同制作者のブログはこちら

[おすすめ本紹介]

Users’ Guides to the Medical Literature


タイトル通り「医学論文を現場でどう応用するか?」迷える臨床家のためのユーザーズガイド。Tips 集のような構成で,どこからでもつまみ読みできます(通読向きではない)。医学論文の批判的吟味を学ぶにあたり 1 冊だけ選ぶならコレ,という極めて網羅性の高い一冊です。著者 Gordon Guyatt 氏は “EBM” という言葉を作った張本人。分厚い本ですが,気軽に持ち歩ける Kindle 版はオススメです。邦訳版もあります。

医学文献ユーザーズガイド 第3版


表紙が全然違いますが「Users’ Guides to the Medical Literature (JAMA)」の邦訳版。医学文献を批判的吟味するためのTips集としてかなりの網羅性を誇る代表的な一冊です。唯一の欠点は Kindle版がないこと(英語版はある)と,和訳が気になる部分が結構あること。2つでした。原著とセットで手に入れると最強の気分を味わえます。鈍器としても使えます

─ ads ─
>医療統計の解説チャンネル

医療統計の解説チャンネル

スキマ時間で「まるきりゼロから」医療統計の基本事項を解説していく Youtube チャンネルを 2 人で共同運営しています。

CTR IMG