【30分で】臨床試験 RCT 爆速チェックリスト【批判的吟味】

目次

回答例

以下では,実際にいろいろな RCT に対する批判的吟味の内容を記載しつつ,チェックリストの埋め方を例示させていただきます。

爆速チェックリストを使う際,御参考にしていただければ幸いです!

爆速チェックリスト Question Answer (例)
Sponsor 財源は NPO/政府系か,製薬会社か 製薬会社主導治験(phase III trial)
Time 追跡期間の中央値は 270日 (IQR:240-300)
Patient 1 サンプルサイズ (n) は十分か 400人。
power 分析をし,その結果と打ち切り見込み数を織り込んで recruit → 十分なサンプルサイズとなっている。OK。
Patient 2 組入れ基準は?(外的妥当性) 一言でいえば「高齢白人で●●な人」
Patient 3 除外基準は?(外的妥当性) ハイリスク症例は除外されているが臨床的にも妥当な範囲。
75 歳以上の高齢者が入っていない(高齢者への一般化はできない)ことに注意。
Patient 4 外的妥当性に関する問題はあるか 参加者はほぼ白人 + 平均 BMI 32。
日本人への一般化可能性は低そう。
Patient 5 重要な因子での群間不均衡はないか 年齢については〈層別ランダム化〉で揃えられている。
他,Table1 の中身は概ね均等そう。
未知の予後関連因子があり,Table 1 に記載されていない可能性もあるが,ランダム化が適切であれば,そうした未知の因子も均等に割り振られていると考える。
Patient 6 最終的に ITT解析か(ランダム化の維持) Primary endpoint については ITT解析をしている。
Patient 7 追跡率は何%か(ランダム化の維持) 「少なくとも80%の追跡率」は満たす。
ただし worst-scenario 解析や,競合リスクを加味した感度分析は行われていない。
Patient 8 打ち切り理由は両群で差がないか(ランダムな打ち切りのみか) 差はないが,ナゾの sponsor decision という除外が試験途中にある
[REWIND] pubmed
Intervention 1 介入群/対照群への割付け手法は隠蔽化 conceal されているか 中央割付方式なのでOK
Intervention 2 介入群/対照群への割付け結果は何重に盲検化 masking されているか 三重盲検(被験者+医師+評価者)
他) PROBE 法(評価者のみ masking, 被験者と医師にはオープン)
Control 1 対照群はプラセボか既存治療か
➡ 既存治療の場合,適切な質で標準治療を行われているか
既存治療
➡︎ 例)warfarin が対照群だが,PT-INRはきちんとコントロールされていなかった
➡︎ 例2) 対照群で尿酸値が上昇したらアロプリノールを考慮しても良いことになっていたが,何故か 100 mg(通常 doseの半量)
[FREED] pubmed
Control 2 介入以外の治療は全て公平になっているか 例)なってない。実薬群に対してプラセボ対照群は明らかに HbA1c が高値のまま放置された状態で長期間追跡されている。その状況下で心血管イベントの発症率を比較されても,実薬群の有利は明白である。患者背景の均質性が途中から保たれていないのだから。
話題の EMPAREG-OUTCOME (pubmed) をはじめ,ここ最近のほとんどの糖尿病新薬の大規模 RCT(安全性試験) がこの問題を孕んでいます。この鋭い指摘はマッシー池田大先生が 2019 年に論文にされています。糖尿病診療を行う全ての内科医が読むべき論文。[Pubmed] [池田先生のblog]
Outcome 1 主要エンドポイントは,代用エンドポイントか,真のエンドポイントか 代用:HbA1c
※真のエンドポイントは心血管疾患の発症リスク減少
Outcome 2 主要エンドポイントは,ソフトか?ハードか? ソフトとハードの複合.
例) 心不全による”入院”が含まれている [FREED] pubmed
Outcome 3 主要エンドポイントは単体か?複合か? 複合エンドポイント
Outcome 4 複合エンドポイントの場合,そのパッケージは許容できるか? 許容できない。
例) 死亡, 脳卒中, 心筋梗塞 など重症なものと 蛋白尿増加, Paf発症など正直どうでもいいものが全て同一パッケージ
[FREED] pubmed
Outcome 5 試験途中でエンドポイントが変更されていないか?(NCT/プロトコル論文) 例) 試験途中で複合エンドポイントの中身が追加されている。
[FREED] NCT
※ Current Primary Outcome Measures と Original – を比較すると,, ?
Outcome 6 二次評価項目で P < 0.05 を全て「有意」と主張していないか(多重検定) 例) Table2だけで 10回検定しているが,結局有意水準 0.05 を下回ったのは腎イベント1つだけ。そのため,結果的にこの問題は犯していない。 [FREED] pubmed
Outcome 7 粉飾的記載 spin をしていないか? spin とは,Primary endpoint で有意差がつかなかったが,サブ解析結果や secondary endpoint,後付けエンドポイント exploratory endpoint での有意差を強調していること。
(※) ただの誇張表現であれば,厳密には spin ではない。たとえば,FREED 試験では Abstract の Conclusion で 本来の Primary endpoint ではなく Secondary endpoint 「腎イベントの減少」での有意差を強調している──結局 何もかもごっちゃに詰め込んだ複合エンドポイントである Primary endpoint には,実質的価値がないことを筆者も認識しているためと思われる──。これはspinの様でもあるが,本試験は Primary endpoint で有意差を出せている試験なので,厳密には spin ではない。単純な誇張であると言える。 なお,有意差の出た「腎イベント減少」の実態としては Cre悪化やESRDへの移行は全く差がなくアルブミン尿を減らしただけである(Table S6)。にも関わらず,”delays the progression of renal dysfunction” となかなかに攻めた記載がされている。[FREED] pubmed
Outcome 8 Effect size (NNT/NNH)は十分か? ELDERCARE-AF試験では,エドキサバン 15 mg 内服による塞栓症予防の NNT は 23 程度と十分であった。ただし,何らか対応を要する出血イベントの NNH 16 程度,消化管出血の NNH も 67 程度あり。
[ELDERCARE-AF] pubmed【解説記事】
Outcome 9 安全性の懸念は? 上記のELDERCARE-AF試験では,エドキサバン 15 mg 内服による 出血イベント risk/梗塞予防 benefit の比較が必要となる。major bleeding は有意差なしということになっているが,実数としては明らかに多いため,サンプルサイズや追跡期間が伸びれば有意となっていた可能性が高い(βエラーの可能性)。試験の追跡率が 70% と低い点もこのあたりをバイアスしうる。
[ELDERCARE-AF] pubmed【解説記事】
Analysis 1 試験は早期終了されていないか? 当初のプロトコル通り完遂されている。
※早期中断は結果の過大評価に繋がるリスクが高い
Economy お値段は? エドキサバン 15 mg は,1日220円,1年間で 73000円
[ELDERCARE-AF] pubmed
【解説記事】

また好例があれば追記していきます。

[おすすめ本紹介]

Users’ Guides to the Medical Literature


タイトル通り「医学論文を現場でどう応用するか?」迷える臨床家のためのユーザーズガイド。Tips 集のような構成で,どこからでもつまみ読みできます(通読向きではない)。医学論文の批判的吟味を学ぶにあたり 1 冊だけ選ぶならコレ,という極めて網羅性の高い一冊です。著者 Gordon Guyatt 氏は “EBM” という言葉を作った張本人。分厚い本ですが,気軽に持ち歩ける Kindle 版はオススメです。邦訳版もあります。

医学文献ユーザーズガイド 第3版


表紙が全然違いますが「Users’ Guides to the Medical Literature (JAMA)」の邦訳版。医学文献を批判的吟味するためのTips集としてかなりの網羅性を誇る代表的な一冊です。唯一の欠点は Kindle版がないこと(英語版はある)と,和訳が気になる部分が結構あること。2つでした。原著とセットで手に入れると最強の気分を味わえます。鈍器としても使えます

─ ads ─
>医療統計の解説チャンネル

医療統計の解説チャンネル

スキマ時間で「まるきりゼロから」医療統計の基本事項を解説していく Youtube チャンネルを 2 人で共同運営しています。

CTR IMG