うがいは新型コロナに「効く」のか?論争について真剣に再考してみる

やはり統計リテラシーをテーマの1つに掲げているはずの当ブログとしては,このネタを扱わないわけにはいかないと思いましたので…

今更ながら

『吉村知事の会見に始まった“コロナうがい薬論争“』

について取り上げさせて頂きます。

ほとぼりが冷めてから取り上げるあたり,チキンハートをお察し下さい🤗

今になったからこそ,改めて,冷静に中立の立場から考えてみたいと思います。

エビデンスについてよく考える機会として,今回の出来事はある意味絶好の教材であるように思います。

吉村知事のイソジンうがい記者会見(8月4日)

振り返ってみますと,ことの発端は8月4日の記者会見でした。

日本経済新聞

大阪府と大阪府立病院機構「大阪はびきの医療センター」は4日、新型コロナウイルス陽性の軽症患者41人に対し、「ポビドンヨー…

私は記者会見の現場にいたわけでもなければリアルタイムで報道を見ていたわけでもないので,ある程度編集されてしまった二次情報や三次情報しか見ておりません。

そのためメディアによる印象操作を受けてしまった可能性は十分にあるのですが,
ともかく「国民に対して相当な誤解を招きかねない,まずい記者会見だった」というイメージが残ってしまっています。

事実としてその日から数日間は,この記者会見そのものの報道や,「街頭からポピドンヨードが消えた」という報道でネットニュースもTVニュースも話題が持ちきりになってしまっていました。

問題となったのは主に

  1. サンプルサイズ41という非常に小規模な「記述研究」(極めてエビデンスレベルの低い研究)の結果を全国報道すべきなのか
  2. 非常に影響力の高い政治家の情報発信の仕方として問題はなかったのか

という2点だったと思います。

①はもちろんのこと②,特にその表現方法に問題があったことが指摘されていました。

松井市長と吉村府知事さんが並んで,ポピドンヨードがずらりと並んで,通販番組みたいだった

と揶揄する声も取り上げられていたように思います。

要は,情報の受け取り手に対して親切ではなかったわけですね。
「ファクト」と「オピニオン」の分離ができていなかった。

「ポピドンヨードが並べられている」という視覚情報の影響も大きく,
とにかく

「うがい薬!」「うがい薬!」「うがい薬!」
「コロナウイルス」
「減る」

という情報だけが視聴者の頭にインプットされてしまいました。

視聴者全員が統計リテラシーのある人だったら,今回の問題は起きなかったものだと思います。

あ〜……
記述研究で,
サンプルサイズは41名で,

指標は《PCRの陽性頻度》ですか…

と冷静に受け止める人しかいないなら,全く問題はないわけです。

「今の時点では何も言えないね」
「これからちゃんとRCTとか組んで検証して欲しいね」

で終わります。

しかし実際には,
ポピドンヨードが街の売り場から消え去る,という現象が起きました。

そもそも伝え方が煽動的であったこともありますが,数字や図表に対して一歩引いたところから批判的に見る,という言わば「統計リテラシー」がある程度身についている人は,まだまだ日本では少数派なのでしょう。

残念ながら,これが日本の現状です(今のところは)。

【補足】
あえてここで「今のところは」と添えるのは,当ブログの到達最終目標の1つが「全国民エビデンスおばさん化」だからです。最低限の統計リテラシーを全国民が身につけられるよう,いろいろな情報をお伝えしていきたいと思っています。

日本ではまだ「統計リテラシーを育む」様な教育は一般的ではありません。

少なくとも義務教育では全くされていません。

そうした人たちを対象にしながら,
「ファクト」と「オピニオン」の分離をしないまま煽る様な会見をしてしまった,しかもそれを影響力の大きい府知事が行ってしまった,ということにはやはり問題があったと思います。

実際この点については府知事も認められており,ひとまず解決した問題です。

一方,やはり医療クラスタや研究クラスタの人たちがあれほどに怒り狂った理由は,そもそもこの研究の質が高いものではないことが明白だったから,というのも大きかったのではないでしょうか。

というわけで以下では,問題となった研究の実際の内容について,わかる範囲で調べてみましたので,少しまとめてみたいと思います。

はびきの医療センターのうがい薬研究の概要

以下の情報のソースは,大阪府のホームページです。

事実確認できたものをここにまとめてみます。

以下は私の手を経た二次情報ですので,正しい情報については上記の一次情報にアクセスしてご自身の目でお確かめいただければと思います。

《対象》

  • 大阪ホテル宿泊療養中の COVID-19 患者(=酸素も不要な無症候性〜ごく軽症例)
  • 調査対象者数(サンプルサイズ)= 41名(うがい薬群と非うがい群あわせて;それぞれ何名だったのかの記載なし)

《手法》

  • 大阪ホテル入所者にポビドンヨード含嗽(1 日 4 回)をしてもらう
  • 当該含嗽者データと,既存の非含嗽例データを大阪府市から提供してもらい,比較検討。 宿泊療養から医療機関への入院搬送を endpoint (アウトカム)として評価する。
  • 合わせて『対象者から採取した唾液検体での COVID-19 PCR 陽性割合の推移』を評価

《結果》

これが,今回大阪府から示された「ファクト」でした。

ファクトとオピニオンの分離

くどいようですが,結局上記の内容「だけ」が,今回この研究において示されたことなのです。

つまり,今回の研究から言えることはこの表にある内容だけであって,
「この表からわかること以上のこと」は,ただの意見,オピニオンなのです。

実際には上記のデータはあまりにも欠落した情報が多すぎる(※後述)ため,本来「このデータからでは何も言えない」ということになってしまうのですが…

それはともかくとして,この図表を見て個々人がどう考えてどんな意見を抱こうとも,それは完全に自由です。

例えばこのデータを見た市民が

ふーん、うがい、しよっかな

と思うのも自由ですし,

このデータを見た府知事が

少しでも手洗いうがい文化が根付いて,一般市民の行動変容が感染制御の面でプラスになればいいな

という思いを抱くのも自由です。

しかし結局そうした知事自身の「意見」や「願い」に過ぎないものを,ファクトと混ぜて報道してしまったのがまずかった,ということだと思います。

ごちゃ混ぜにされたファクトとオピニオンをしっかり分離して受け止められる視聴者ばかりではありませんから,この2つは明確に分離して扱うべき内容でした。

あの会見で示されるフリップが

  • いまわかっている事:
    「試験管レベルの実験では,COVID-19に対してポビドンヨード液も一定程度の効果がありそうと言われているよ」
    「今回,大阪でも41人という極めて少ないケースだけれど,唾液PCRの陽性率を追っかけながらうがいの効果を確かめてみたら,少し手応えがあったよ。でも全然データ不足だから有意とは言えないレベルだし,実際の重症化率や周囲への感染率へどの程度影響があるかは全く調べきれてないよ

  • これから確かめたい事:
    「本当にうがいの励行でCOVID-19の重症化や感染率を下げることができるのか,大規模なRCTを組んで確かめたいと思っているよ」

  • 知事の個人的な意見とお願い:
    「まだまだ科学的なデータは不足しているけれど,うがいでリスクを被ることは少ないと思うし,みんなしっかり手洗いうがいをしてくれよな!」
    「ただし甲状腺機能が潜在的に悪かったりする人はあまりイソジンが良くないとされているから,やり過ぎは注意だぞ。水うがいでもいいから,手洗いと合わせて,やれそうな感染対策は各人しっかり生活に取り入れてくれよな!」

明確に分離されたフォーマットで構成されていれば良かったのだと思います。

このようなフォーマットでの記者会見であれば,ただただ支持者の胸を熱くするだけの good ニュースとして済んだのではないでしょうか。

特に,この研究のLimitation(限界)についてきちんと明言する,ということがやはり「伝え方」の面で大切だった様に思います。

知事だってなにも世間の混乱を狙って会見を行ったわけではないでしょう。

純粋に善意から「少しでも可能な範囲の工夫で,府民全員が気をつけて欲しい」という思いからの行動だったとのではないでしょうか。

伝え方や統計リテラシーに問題はあったにせよ,その熱さや行動自体を頭ごなしに非難すべきではないように思います。

むしろ今回の事件に関しては,知事のバックにいる専門家や,
専門家と知事をつなぐ人物に責任があったのではないでしょうか。

  • 専門家が府知事に対して誤解を与える様な説明をしていなかったか?
  • あの会見をする前に,発表内容などについて専門家のチェックは受けていたか?

という点については今後こうした事件を防ぐためにも重要な検討課題だと思います。

手続き上の問題もあったかもしれませんね。

非難すべきは府知事個人ではなく,ああいうことが起きてしまう「構造」の方だと思います。

【補足】
なお,あくまでも悪質な意図があってあの様な会見をしたという【府知事性悪説】に則ると「インサイダー取引があったのでは」(つまりあらかじめポピドンヨードの会社の株を買った人とつながっていて,あの報道により株価をぶち上げた)という疑惑につながるわけですが,私個人としては【府知事性善説】を唱えたいです。常識的にはそう考えるべきだと感じます。

とにかく,ファクトとオピニオンを分離すること

これだけは今後,全【情報発信者】の方々が強く意識する様な社会になってくれることを切に願います。

─ ads ─

今回のうがい研究における Limitaion

一応,「伝え方」でない方の問題点,つまり「そもそも研究自体の質がどうだったのか?」という点についても整理してみたいと思います。

例の記者会見で Limitation(研究から言えることの限界)について明言されていなかった という問題は既に述べた通りですが,実際「上記の研究のどのあたりに不足があるのか」について,あまりピンとこなかった方もいらっしゃるかもしれません。

実際に確認してみましょう。

先ほどの研究でPDF上に示されていた図表を,もう一度見てみます。

確かに一見すると良さそうにも見えるデータなので,統計学に則ったデータの扱い方に慣れていない方がみると,なんだかすごくコロナウイルスが減ったかの様に見えてしまうかもしれません。

しかし見る人が見ると,「これは…」と苦笑してしまう図表です。

そもそも,この図表からは得られる情報が制限されすぎています。
そのせいで,どう解釈していいかわからない部分が散見されます。

府が先導する臨床研究の報告書としてこのPDFがupされているのは,さすがに少し寂しい思いがしますね。

国民の統計リテラシーが相当低く見積もられているのではないでしょうか…。

以下に Limitation を箇条書きにしてみます。
少し専門的な用語も混じってしまいますが,読み飛ばして下さい。

なお【RCT】についての基本的な知識は前提として記載させていただいておりますのでご了承ください。

わからない単語が多ければ,RCTについてざっくり解説した記事の方もご覧いただけますと幸いです。

合わせて読みたい

この記事には案内役としてネコが登場します。この記事では 「RCT の定義」「RCTであるための要件」 について掘り下げて解説しています(▼)。RCTの満たすべき条件ランダム化されている比較対照(control群)がある[…]

【Limitation】(この研究で得られる知見の限界)

  1. 被験者がランダム化されていない
    • ランダム化されていないため,「ヨード群」と「非うがい群」の背景因子が揃っていない可能性が高い。
    • 年齢,基礎疾患の有無,初期症状からの経過日数,診断日からの経過日数,もともとの口腔ケアの回数や習慣,などなどの情報は最低限揃えるべきだと思います。これらが揃っていないと,「結果の差」がヨードの効果によるものなのか,もともとの背景因子の違いが生んだものなのかがわかりません。
    • 事実として初日の時点で既に「PCR陽性検体の割合」に差が出てしまっており(68.8% vs 56.0%),スタート時点で背景因子が揃っていなかった可能性が強く疑われます。
  2. アウトカムの設定が適切でない
    • そもそも研究目的である「うがいで“重症化抑制“効果があるのか?」という疑問に対し,アウトカムの評価項目として「唾液 PCR の陽性割合の変化」を据えることは妥当ではありません。アウトカムが,疑問に対する答えになっていないのです。「その時の唾液の PCR でウイルスを検出するかどうか」は「重症化」と全く関連性のないパラメータです。
    • 重症化抑制効果を調べたいのであれば,入院率,入院日数,ICU入床率,ICU退室までの日数,酸素離脱までの日数,など(の差)をアウトカムに据えるべきです。
    • 実際当初は「入院搬送」を endpoint (アウトカム)として組んでいたことが,PDF上でも明記されています。 しかし,結局そうした評価項目について結果が実際にどうであったかについては,一切記載がありません。もし「当初の endpoint では有意差が出なかった」から,代わりに「唾液 PCR の陽性割合の変化」という(一見差がありそうには見えるが臨床的意義の乏しい)データのみを載せた,ということであれば,「endpointのすり替え」という典型的なインチキ手口です。もはや研究モラルの話になってしまうため,そうではないと信じたいですが…。
    • 本来,ある主要 endpoint を設定して,それについてダメだったならダメだったで,そのことは結果として明記すべきなのです。「本来の目的とは違うけれど,他の項目では差が出ました」ということであれば,それは副次アウトカムとして,あくまでおまけで発表とすべきなのです。研究者にとってはそれが常識です(お役所とのいろいろなやりとりがあってこういう記載になったのかもしれませんが…)。
    • ただ,よく見ると「これまでの」研究成果としっかり「お断り」があるので,やはりあくまでパイロットトライアル的な部分だけ示した形なのでしょうか。
  3. それぞれの群の検査数(検体数)が不明

    • 図表には「PCR陽性検体の割合」しか書かれておらず,それぞれの群の「検査数(検体数)」が書かれていません。そのため,Day1 から Day4 までの「PCR陽性検体の割合」を比較しても統計学的に有意な差が出ているのか検証できません。
    • 検査数が記載されていないため,それぞれの群で,打ち切り例(censoring)がどの程度いたのか全くわかりません。療養施設を退所したりして追跡をやめた症例もいたかと思いますし,重症化して入院したケースもあったかもしれませんが,いずれもどの程度いたか不明で,それぞれどこまで唾液PCRを追跡したのか不明です。こうした打ち切りによる数字への影響が考慮(補正)されていないため,バイアスのリスクがあります。
    • いずれにせよ,統計的な検定を行っているのであれば結果を明記すべきだと思いますし,そのために必要なこうした重要なデータは記載すべきだと思います。そうしたデータを記載していないことで,かえって「有意差がないデータなのでは?」という邪推を生んでしまいます。
  4. 盲検化されていない

    • 「うがい群」の人の方が「早く治そう」という意識がどんどん高まっていった可能性があり,それによる結果への影響があった可能性があります。
    • 例)うがい群の方がより健康意識が高くなり,睡眠時間をたくさん確保する様に心がけ,それが良かった。
  5. 唾液採取のタイミングが不明
    • PCRを行った唾液検体の採取タイミングが明記されていません。きちんと指定していたかも不明です。もし採取直前にがっつりイソジンうがいをした人も混じっているのであれば,PCRの陽性割合が下がるのはごく当然のことです(もともと試験管内の実験では,イソジン液のウイルスへの効果は一定程度示されています)。
    • もし唾液採取がうがい後間もなくのタイミングだとすると,PCR が陰性となっていても「体内からウイルスが減った」などとは当然言えません。「うがい直後には,唾液から数分だけウイルスが検出されなくなった」というだけのことです。その効果がどれだけ続くかも不明です。果たしてこれは,臨床的に意義のあるデータでしょうか? むしろこの結果を悪用し,わざと検体採取直前に口の中をめちゃくちゃ消毒してから唾液PCRを出し,(偽)陰性という免罪符を得んとするモラルハザードが起きる可能性すら懸念されます。
    • もちろんこの点に関しては,記載がないだけであり,唾液採取との間には一定の時間を置いていた,という可能性はあります(ただし明記されていない時点で,そうした考慮もされていなかったのでは?と邪推されるのは当然です)。
  6. 追跡期間が短い
    • 追跡期間が非常に短く,4日目までしか記載がありません。一見4日目ではそれなりの差がある様に見える表ではありますが,仮に陽性割合の差が「4日目の時点」では有意だったとしても,「5日目の時点」では全く差がなくなっているかもしれません。その様に「たった1日に満たない差」は,臨床的に意味のある差とは言えません。
    • 通常は追跡期間を両群でしっかり揃えて比較すべきですし,「PCRで両群とも検出されなくなるまで」は通常追跡を継続すべきです(その日数の差が統計学的に有意であれば一定の意味があるため)。
    • 既存のデータとの比較という観察研究であるため,それらをうまく揃えられなかった可能性がありますが,これがかなりの limitation であることは明記すべきです。
    • 5日目以降のデータを示していないことで,かえって「5日目以降はほとんど差がなかったのでは?」という邪推を生んでしまっています。
  7. 比較対照が不適切
    • そもそも比較対照に「水うがい群」ではなく「うがいをしていない群」を据えているため,仮に結果の差が有意としても,「ポビドンヨードの効果」によるものなのか「うがいそのものの効果」によるものなのか不明です。つまり,水うがいでも十分という可能性があります。また,先述の通り,盲検化の問題もあります。
  8. サンプルサイズが小さすぎる
    • 検証した人数が少なすぎるため,この現象を一般化することはできません(外的妥当性が極めて低い)。
    • どの点について検定を行うかにもよりますが,おそらく今回の研究結果では,ほとんど統計学的有意差は出ていないのではないでしょうか。4日目のデータだけで比較すれば有意差は出るのかもしれませんが…検体数が記載されていないため,その検証すらできません。また,仮に4日目の陽性率では有意差があっても,5日目の陽性率では有意差がないかもしれない,という可能性は先述の通りです。

などなど…

上記の様な数多くの Limitation が想定されるため,府がホームページに掲載している上記PDFからわかるデータからは「特に何も言えない」ということになってしまうわけですね。

いや本当に,上記のすべてはごく簡単に指摘できる問題点です。
少しでも医学・疫学研究や統計学をかじった人ならすぐにわかることばかりだと思います。

ただただ妥当な医療統計の手法に照らして話をすると,
「このデータからでは何も言えない」。

こればかりはどうしようもない事実です。

補足
もちろん実際にはもっとしっかりデータを集めていると思いますが,それが公表されていないのが問題です。少なくとも私たち市民がアクセスできる範囲(府が公表しているPDFの中身)に示されたデータからでは,何ら有意なことは得られません。

そもそも観察研究はバイアスリスクの非常に高い研究方式なのですが,掲載されているPDFはそれ以前の問題が多過ぎます。

結論に持っていくために重要なデータがことごとく記載されておらず,
「意図的に載せていないのでは……?」と邪推されても仕方ないほどです。

示されないデータは,無いものと同義なのです。

仮に「一般の人向け」だから分かりやすくするため端折った,という言い訳をするにしても,端折られた部分が全てバイアスを生み出すピンポイントのところばかりなので,見る人が見たら「悪徳商法の手口と一緒…」という印象を受けます。

この様なデータの集め方では,うがいによる「重症化予防効果」や「治療効果」などはもちろん示せませんし,「PCR陽性割合の低下」という(すり替えられた)主要 endpoint すら,統計学的に有意なものなのか分からない状況です。

【※】そしてそもそも「唾液中のPCRの陽性割合の低下」がアウトカムとして不適切なことは上述した通りです。

ですから,「このデータを元にして」「イソジンうがいを励行する」
というのは完全にナンセンスになってしまっています。

かえってこのデータを載せずに,ただ知事が個人的な意見として
「みんな手洗いうがいしような!」
と言ってもらった方が説得力があったくらいかもしれません。

エビデンスには本来,「自分の意見の論拠として提示することで,説得力をより強固なものにする」という効果があります。

しかしそのエビデンスがガバガバだと,かえって説得力を削いでしまうものです。

今回の件でいえば,むしろこの研究の元になった(と思われる),in-vitro つまり試験管レベルでの実験を紹介した方が説得力があるくらいかもしれません。

【補足】 本来は in-vitro のデータの方がエビデンスレベルが下なのですが,上記のPDFに記載されたデータからでは,研究手順にも結果にも疑問がありすぎるため,エビデンスとして採択することすらできないかもしれない,ということです。

繰り返しになりますが,ここで取り上げた内容は,少し科学や統計(特に医学統計)をかじったことのある人であればすぐ気づく様なことばかりです。

そのくらい明白に欠落の多いデータでしたので,さすがに専門家界隈からお叱り総攻撃を喰らってしまった,という構造だと思います。

というより,そもそもはびきの医療センターの研究者の方々も,今回このデータについて「研究」という意識でやっていないのではないでしょうか?

本番の研究(RCTなど)につなげるための,「とっかかりのとっかかり」で,パイロット・テストくらいのテンションだったのではないかと思います。
世間に公表するなど,あまりにも時期尚早です。

本来この研究チームの方々は,この次のステップとして,より大きなサンプルサイズ,より科学的に妥当なプロセスでの研究を進めていきたい,ということだったのではないでしょうか。

それを何かの手違いで,誰か(統計リテラシーに欠けた人物)が,府知事に耳打ちしてしまったのではないかと。

あとは府知事の正義心と行動力に火がついて,あの様な惨劇が起きてしまったのではないかと推察致します。

この点に関しては「府知事がきちんと見抜くべきだった!」というような論説も多く目にしたように思いますが,多忙な府知事が全部のデータにいちいち目を通すなんてことは実際難しいでしょうから,やはり府知事に耳打ちした人物の責任が重いのではないかと思います。

もちろん府知事に統計リテラシーがしっかり備わっていて,データの不備を見抜ける,というのが理想ではあったと思いますが,そうした専門性の高い内容の判断については,専門チームに分離すべき仕事だと感じます。

つまり結局今回問題だったのは,

  • 知事のバックの専門家のデータ解釈が甘かった
  • 専門家から府知事への伝え方が悪かった
  • 専門家と府知事を結びつける構造自体に問題があった
  • そもそも医療・統計などに詳しい専門家やシンクタンクがなかった

のいずれか,あるいは全てだったかもしれません。

特にシンクタンクがない,という点に関しては,日本自体にCDCがないという大問題に通ずるポイントの様な気がします。

いずれにせよ,この辺りは今後構造的な改善がされることを期待したいです。

これは何も大阪府に限ったことではなく,全国どの自治体でも,あるいは国レベルですら同様の「データを扱う際の問題」は起きえます。

むしろ今回は「話題に上がっただけマシな方」かもしれません。

日本の至る所で全くエビデンスに則らない政策決定がされていることを思えば…

EBPM(エビデンスに基づく政策決定),早く日本でも一般的になって欲しものです。

補足②:その他の問題点

なお,他に医療者からよく上がった批判としては下の2つが挙げられます。

  1. イソジンの主成分はヨウ素であり,ヨウ素は過剰摂取で甲状腺機能を低下させることが知られている
  2. 先行研究として,水うがいとイソジンうがいを比較した日本の RCT があり,水うがいの方が「上気道感染の予防効果」は高かった(京大の研究

特に 1. の方は実際に大きな問題で,日本人は潜在性甲状腺機能低下症の有病割合が比較的高いとされていますので,そうした女性が無駄にイソジンを使いまくってしまうと,潜在性-から顕在性-にレベルアップしてしまうリスクがあります。

イソジンうがいが「完全にノーリスク」であればあまり大きな問題でもなかったかもしれないのですが,上記のような「一定のリスク」があるために,これもまた医学会からの反発が強くあったのだと思います(買い占めのために本当に必要なところに届かなくなるという問題もありましたが)。

そのため,あの会見が「水うがいを推奨する」ものであったなら,あそこまで紛糾した事態にはならなかったことでしょう。

一方,2.に関しては,そもそもコロナウイルスに関する先行研究ではなく上気道感染(≒風邪)の予防に関する研究です (Pubmed) ので,反証として提示するのはどうかなと思います。

ただ一般に,こうした先行研究があるため「かぜ予防目的の」イソジンうがいを勧める医師はほとんどいません。
それは事実です。
甲状腺の問題もありますしね。

「うがいが効かない」わけではない

さて,これまでは後ろ向きに今回の事件について取り上げてきましたが,ここからは前向きの話をしたいと思います。

次はどうしたらいいのか?です。

誤解されている方が多い様に感じるのですが,上記の研究やその記者会見には問題があったものの, 「コロナ予防にイソジンうがいは効果がない」 ということではありません。

水うがいとイソジンうがいの「風邪予防効果」を調べた上記の研究 (京大) を取り上げて,「うがいなんかでコロナはよくならねーよ!」といった決めつけをする様な意見も散見されましたが……

しかし実際には,「効果がない」なんて,そんなエビデンスもまた,ありません。

むしろ In-Vitro (つまり試験管内の実験)であれば,新型コロナウイルスに対してもイソジンが有効という報告はもともとありました。

そもそもそうした既報があったからこそ,今回の研究が行われたという順番だと思います。

問題は,その In-Vitro の結果が,ヒトを対象にして実際に医療の枠組みに入れたとき,本当に「効果があるのか」はまだ分かっていない,ということなのです。

そしてそれを示すには,上記の研究はあまりにもデータが薄弱すぎて,何も言えていない,ということです。


エビデンスがないということは,「違う」ということの証明ではありません。

「これから知見を積み上げなければ分からない領域」ということなのです。

そもそもエビデンスの創出には【段階】があります。

  1. 【In-Vitro】動物実験や試験管実験のデータを得る
    • 試験管内実験で,イソジン液に浸すことでCOVID-19の感染力は落ちるらしいというデータを得る
  2. 【記述研究】(観察研究)
    • 「不思議と重症化しなかったハイリスク高齢COVID-19症例が数例あった」「それらの症例の共通点として,どうやら結構うがいをしていたらしいぞ」といった報告を複数集める,など(=記述研究の一種;ケースシリーズ)
  3. 【分析的研究】(観察研究)
    • COVID-19で重症化したケースと,重症化しなかったケースを複数集めて,それぞれが定期的なイソジンでのうがいをしていたか,していなかったかについて分析。「うがいをしていた」ことと「重症化しなかった」ことの関係性に有意な相関関係(※因果関係ではない)があるかどうか検討する(=分析的研究の一種;症例対照研究)
  4. 【介入研究】特にランダム化比較試験(RCT)
    • 実際にCOVID-19患者を「診断直後に」ランダムに「水うがい群」「イソジンうがい群」に割り付けて,入院率や重症化率を主要アウトカムに設定したRCTを組む。十分なサンプルサイズで,研究者やデータ解析者がいずれも盲検化される様にする。比較対照は「水うがい」でもよいが,理想的には「味だけポビドンヨードうがい液にそっくりにした偽薬」をきちんと用意してプラセボ比較での二重盲検試験とするのが望ましい。
  5. 【複数のRCTの統合】
    • 複数施設や複数国でのRCTの結果を集めて解析する(メタ解析)。

要するに今回は,上記の段階でいうところの【2】に過ぎない部分だったのです。

本来,記述研究の結果からいきなり何かを提案することはできません。
バイアスのリスクが極めて高い研究手法ですからね。

もっとエビデンスレベルの高い研究につなげましょう,という結論になるだけです。
しかし,そこを全部すっ飛ばして世間に大々的な公表をしてしまった。

そしてその情報の受け取り手のほとんどに,そうしたリテラシーがまだ備わっていなかった。

そこが問題の本質である様に感じます。

つまり端的に言えば「あまりにも早い段階で騒ぎすぎた」,ということです。

【補足】 なお本研究は実際,研究者たちの指示によって被験者にうがいをさせているような設計に見えます。つまり観察研究というより介入研究のようにも見える設計です。しかし,いずれにせよ non-randomized, non-controlled, non-blinded な上に endpoint のすり替えが行われている,という状況ですので,観察研究と同レベルの扱いで良いと思われます。実際,公表されているPDF上でも「観察研究」と明記されています。

うがい薬の効果を本当に示すための研究

前項で,エビデンスの創出の過程をお示ししました。

では,実際どのレベルまで行けば「うがい薬の有効性が示された」ということができるのでしょうか。

これには諸説あるのですが,一般的には上記の【4】の段階,つまり ”RCT” を組んで検証すれば,「重症化予防効果が本当にあるのか」について一定程度の「白黒」は付けられる,とされています。

【補足】 一定程度,と断らなければならないのは,結局 RCT の質もピンキリであり,様々な Limitation は残ってしまうからです。しかし観察研究よりは極めてバイアスのリスクが低く信用性の高い研究手法です。

最終的にはもちろん「複数のRCTのメタ解析」の段階まで行ったところでより自信を持って世間様に推奨できるわけですが,単発のRCTの段階であっても,それが適切にデザインされたRCTであれば,論拠としては十分提示できるエビデンスとなります。

というわけで,私はここで強くこう申し上げたいです。

大阪主導の RCT で,早いとこ白黒付けましょうよ。

と。

実際,研究チームは今回のパイロットテストの様な観察研究の後,2000人規模の臨床試験を検討しているとの報道もありましたし,そちらの結果に期待したいところです(まさか今回の事件のせいで頓挫したりしてませんよね…?)。

事実海外でも,うがい薬の有効性について調べる RCT は既に動き出しています。

  • AMPoL trial(アメリカ)120 例 4 アーム;ウイルス量が主要アウトカム
  • GARGLES trial(パキスタン)50 例 5 アーム;ウイルス量が主要アウトカム

上記の二つはどちらもパイロットトライアル的な感じで,非常に小規模かつまあまあ質の低そうな研究デザインではあります(特にパキスタンは1アーム10例ですから相当サンプルサイズが少ないです)が…

ともあれ,日本でこんな小規模な観察研究を取り上げて紛糾している間にも,海外ではさらに先の段階である「RCT」 の症例集めが既に進んでいることは事実です。

そもそも,これも誤解してしまっている人が多い様に思うのですが(メディアの偏向報道のせいですか?),うがいや口腔ケアに着目する発想自体は絶対に悪くない筈なんです。

発表の仕方や,研究手法がまずかったというだけなんです。

誤嚥性肺炎の予防などの観点からも,口腔ケアが特に高齢者医療で重要なことであるのはもはや医療者の世界では常識です。
そして誤嚥性肺炎の合併リスクが下がれば,COVID-19 の重症化予防になる可能性はあるかもしれません。

その意味で,このコロナ禍で改めて口腔ケアの重要性をきちんと検証する,というのは重要な考え方です。

むしろ何より心配なことは,今回の騒動があったことで,日本でそうした検証のための RCT を組みにくくなってしまわないか,ということです。

この後たとえば大阪府やはびきの医療センターの研究グループが,より正確な科学的検証のためランダム化比較試験(RCT)を組もうとしても,

「まだうがい薬のこと引っ張ってんの?」

だとか

「いやあ〜その研究,またメディアに叩かれたらアレだからやめときませんか?」

などという様な否定的な横槍やバイアスが入ってしまわないか。

この点が非常〜〜…に心配です。

しかしその上でもあえてもう一度申し上げたい。

RCT で白黒付けましょうよ。

いや,本当に。

メディアの皆さんもそういう方向性で報道して頂けませんかね?
本当に。

よろしくお願いいたします。

パキスタンに先,越されてますよ!!

まとめ

というわけで,今回は大阪府のうがい薬にまつわる騒動について個人的な意見をまとめてみました。

総括しますと,

【まとめ】

  • 「伝え方」に問題があった(ファクトとオピニオンの分離)
  • 研究の質が低いためそもそも何か言える様なデータなんてなかった
  • ただし「うがいに効果がない」というエビデンスもない
  • むしろ試験管内の実験であれば効果は以前から示されている
  • むしろコロナ禍での高齢者の口腔ケアの重要性を再検討するのは重要
  • 早くRCTを組んで白黒はっきりさせましょう!!

ということですね。

後日談

なお,実はこの事件の後 8月22日に,大阪府の吉村知事が Twitterで
意味深なツイートをされた
ことがまた話題になっていたらしいです。

吉村知事のtweet

ここで紹介されている論文は

“Virucidal Efficacy of Different Oral Rinses Against Severe Acute Respiratory Syndrome Coronavirus 2″  (※リンク先は Pubmed原著ページ)

と題するものです。

直訳すると「口腔内洗浄液による SARS-CoV-2への抗ウイルス効果」となります。

中身をみてみますと,In-vitro(つまり試験管内)の実験報告でした。

ざっくり言えば,いろいろな市販の口腔洗浄液(イソジンうがい液やリステリン®︎を含む)の中に,ウイルス液をそれぞれ 30 秒程度ひたひたにして,その後の培養細胞に対する感染力の検証を行なった,という研究です。

いわゆる「基礎研究」の領域(ヒトを対象としない研究)であり,むしろはびきの医療センターが行った観察研究よりもエビデンスレベルとしては「前段階」にあたる内容です。

この論文について前後に知事がコメントをされたりはしていないようで,ただ ぽん と論文のデータを貼り付けられただけですので,その真の意図は誰にもわかりません。

あまりにいろいろな人がごちゃごちゃ言うので,一番ベースとなる研究について世間様と共有しておいたということでしょうか?

ただしそうした意図の説明もなかったため,結果としてこのツイートはまた結構な物議を醸していた様です(大半は「まだ言ってるのか」という様な批判)。

いずれにせよ,多くの方はこの論文をしっかり吟味することはできないでしょうから(特にMethodsの部分),この「論文を貼り付けるだけ」というツイート自体が割と不親切にも思えますが…。

ただ,紹介されていた論文の中身自体は割と面白い内容でしたので,次の記事で解説してみたいと思います!

こうしてメインコンテンツの執筆が着々と遅れていくのでした 🤗

[おすすめ本紹介]

User’s Guides to the Medical Literature


EBMを学ぶにあたり 1 冊だけ選ぶとしたら間違いなくコレ,という一冊です。著者 Gordon Guyatt 先生は「EBM」という言葉を作った張本人。かなり網羅性が高く分厚い本ですが,気軽に持ち歩ける Kindle 版はオススメです。邦訳版もあります。

医学文献ユーザーズガイド 第3版


表紙が全然違いますが「User’s Guides to the Medical Literature (JAMA)」の邦訳版です。一生言い続けますが,EBMと言えばこの1冊です。唯一の欠点は,Kindle版がないこと(英語版はある)と,和訳が気になる部分が結構あること。2つでした。原著とセットで手に入れると最強の気分を味わえます。

─ ads ─
>医療統計の解説チャンネル

医療統計の解説チャンネル

スキマ時間で「まるきりゼロから」医療統計の基本事項を解説していく Youtube チャンネルを 2 人で共同運営しています。

CTR IMG