前回の記事で,検査や所見の〈感度・特異度〉は,コンセンサスのあるリファレンス・スタンダードに照らし合わせたものである,ということを述べました。
●●スコアが ×× 点 なので,その疾患は否定的だと思います! ●●スコアの感度は 95% もありますので! PCR検査が陽性なので! COVID-19 だと思います!特異度は 99 % です! …… こうした論理はしばしば現場で耳に[…]
ところが実際には,その「照らし合わせ」の過程にも,バイアスの入り込む余地があります。そしてそれらのバイアスのため,研究結果で報告されている感度・特異度は「不自然に高く」なっている可能性があります。
論文読者である私たちは,その点をきちんと見抜いた上で割り引いて考えなければなりません。
そうでなければ,臨床現場での選択を間違えてしまう恐れがあります。
この記事では,リファレンス・スタンダードとの照合に関連するバイアスとして
- 情報バイアス(狭義)── 「答え」を知っていることで影響を受ける
- 検証バイアス ── 陽性者でしか「答え合わせ」をしない
の2つについてまとめたいと思います。
情報バイアス information bias
情報バイアス information bias とは,
を指す言葉です。
医学研究は情報収集がすべて
医学研究 ── とくにマウスではなくヒトを相手にした「臨床研究」というのは結局のところ,突き詰めればすべて「情報収集」によって行われます。
- ある要因への曝露(e.g. 喫煙歴)
- アウトカム(e.g. 肺癌を発症するかどうか)
- その他の関連する要因(e.g. 家族歴)
などについて「情報収集」して,それらの因果関係・相関関係を調べるのが臨床研究です。
「情報を持つこと」が判断を歪める
ところが,事前に情報を持った状態でデータ収拾をしてしまうと,それが先入観となって,データ収集に影響を与えてしまうことがあります。
無意識的に関連付けを行ってしまったり,より「仮説に合致する現象ばかりを取り上げる」といったことを行ってしまうわけです。
診断研究における情報バイアス
新しく考案された診断法や身体所見などの有用性を評価する〈診断研究〉においても,このバイアスは大きな影響を与えます。
他の検査結果の情報は伏せる必要がある
とくに,リファレンス・スタンダードの診断結果(=答え)を知った状況で新しい手法が施行されると,その結果の解釈が大きく歪められてしまう危険性があります。
わかりやすく言えばこれは「カンニング行為」みたいなものです。
ほかの検査結果を見てしまうことで,「今回の検査結果」の「判定」が影響を受けてしまうわけです。
判定者は意図していなかったとしても,知らず知らずのうちに,その結果に影響された結果判定をしてしまうものです。
特にリファレンス・スタンダードの結果(=答え)をあらかじめ知ってしまっていると,現実を遥かに上回る「正答率」を叩き出す ── 偽陽性や偽陰性が極端に減る ── ことになります。
身体所見の場合は特に影響が大きい
この問題は,とくに身体所見の感度・特異度を算出する場合,顕著になりやすくなります。
たとえば,すでに別の検査で「乳がん」とわかっている人に対して乳房触診による異常を確認すると,検者は軽微な所見も陽性と取りやすくなってしまうでしょう。
また逆に,すでに「乳がんでない」と確定している人に対して乳房触診による異常を確認すると,軽微な所見であれば陰性と判断しやすくなります。
つまり,偽陽性・偽陰性が著しく減ってしまうのです。
これでは,「乳房触診」による「乳がんの組織診断に対する感度・特異度」は極端によくなってしまい,現実と乖離してしまいます。
情報バイアスを防ぐには
こうした〈情報バイアス〉を防ぐためのシンプルな手法は,きちんと盲検化を徹底することです。
つまり,それぞれの診断法は,他の診断法の結果を知らされずに,完全独立に行われなければなりません。
検証バイアス verification bias
もう一つの問題は〈検証バイアス〉 verification bias です。
検証バイアスとは
リファンレンス・スタンダードによる検証(確認)をしないことによって,偽陰性が極端に減ってしまうバイアス
のことを指します。
診断研究における検証バイアス
これは「検査陽性」となった場合にだけリファレンス・スタンダードの検査をおこなって答え合わせをおこない,「検査陰性」となった場合には答え合わせをサボってしまう,ということで生じるバイアスです(▼)。
なぜそのようなことが起きるかというと,大抵の場合リファレンス・スタンダードの検査は高侵襲であったり高価であったりするためです。
患者さんや研究者に強いるコストが大きいため,これらの検査はそもそも,安易にバンバンおこなえるような検査ではありません。
そのため,検査特性を評価したい検査の陽性者でのみ「答え合わせ」を行い,陰性者は「答え合わせ」を行わずにそのまま経過観察する,といった手法がしばしば取られてしまいます。
結果,陰性者はそもそも「リファレンス・スタンダードによる検証」を受けることがないため,そもそも構造的に「偽陰性」が見つかりようがないのです。
そのため現実と比べ極端に偽陰性が少なくなり,感度が不当に高く見積もられることになってしまいます。
その意味で〈検証バイアス〉というよりは〈検証おサボりバイアス〉と言った方が現実に即しているかもしれません。
情報バイアスと検証バイアス
実をいうと〈検証バイアス〉も広義の〈情報バイアス〉に含まれます。
検証バイアスも「情報収集」の手法的な問題によって生じるバイアスには違いないからです。
ただ,この〈検証バイアス〉は,先述した〈情報バイアス〉の一種と比べると,時系列が「逆」になっています。
結論をすでに知っているという「カンニング」によって,新しい検査・所見の「正答率」が異常に高くなってしまうのが先程のケースでした。
一方〈検証バイアス〉は,「検査陰性ではそもそも答え合わせをしない」ことによって成績が底上げされてしまうバイアスです。
検証バイアスを防ぐには?
検証バイアスも,結局のところ一種の〈情報バイアス〉ですから,これを防ぐ手法は先述したものと同様です。
「リファレンス・スタンダードの検査」と「検査特性を判定したい検査」を,それぞれ完全に独立に,全ケースに対して行うしかありません。
独立に両方の検査をおこなった上で,その一致率を算出しなければ,感度・特異度は現実にそぐわぬ高値になってしまいます。
ということですね。
まとめ
- 情報バイアス(狭義)── 「答え」を知っていることで影響を受ける
- 検証バイアス ── 陽性者でしか「答え合わせ」をしない
検査や所見の〈感度・特異度〉は,コンセンサスのあるリファレンス・スタンダードに照らし合わせて算出されたものです。
いうなればリファレンス・スタンダードの結果をどの程度「代用しうるか」という指標が〈感度・特異度〉であると言えます。
しかしその「照らし合わせ」の過程で,上記のようなバイアスが入り込む余地がなかったかどうか,読者は批判的吟味を行う必要があります。
論文のデータを鵜呑みにしてしまうと,不当に高い感度・特異度であるかのように誤解してしまいかねず,注意を要します。
●●スコアが ×× 点 なので,その疾患は否定的だと思います! ●●スコアの感度は 95% もありますので! PCR検査が陽性なので! COVID-19 だと思います!特異度は 99 % です! …… こうした論理はしばしば現場で耳に[…]