この記事では「医療従事者が統計学を勉強するとき、結局なにから始めたらいいのか問題」について私見をまとめます。
到達したいレベルを認識する
統計学の基礎教養は今やあらゆる職業人にとって欠かせないものになっています。医療従事者に関わらず、職業人であればあらゆる意思決定の背後にある「数字」「統計」に気を配らなければならないことでしょう。統計学を学ぶことは、そうした数字に踊らされないために必須の教養とすら言えます。
しかし職業人が少ない余暇時間を削ってわざわざ「統計学を自主学習」するのは簡単ではありません。私自身も多くの挫折を経験し、その過程で色々な書籍に手を出してきました。
それらの経験を経て私が感じたのは「最初に自分のゴール設定を明確にする」ことの重要性です。つまり、どのような環境でその統計リテラシーを活かすことを想定しているのか。その具体的な到達目標に合わせた学習計画を立てることが重要です。それによって求められる前提知識は大きく異なり、手に取るべき書籍も大きく異なるからです。
私自身は現在、統計学の学習段階をざっくりと以下の 3 段階で考えるようにしており、個人的にはしっくり来ています。
- Step 1:文献ユーザー(=論文読者)のためのリテラシー
- Step 2:統計ユーザー(=研究者)のためのリテラシー
- Step 3:より高度な専門ドメインのためのリテラシー
統計リテラシー Step1〜3
まず端的にそれぞれの内容を紹介します。
Step1:文献ユーザーとしてのリテラシー
Step 1 は文献を適切な方法で読み、自ら解釈し、現場に応用するためのリテラシーです。
医療従事者の仕事は、当然ながら患者さんにベストな診療を提供することです。これは EBM の文脈で言うところの best available evidence を適切に吟味し現場で活用するという話に他なりません。しかし臨床文献の吟味には一定の知識が必要であり、それを「文献ユーザーとしてのリテラシー」すなわち Step 1 の統計リテラシーと位置付けます。
論文の読み方を知れば、当然医学ニュースやプレスリリースも適切に解釈することができるようになります。臨床のプロならぜひとも身につけておきたい基礎教養、と言えるかもしれません。詳しくは後ほど述べます。
Step2:統計ユーザーとしてのリテラシー
次のステップは「統計ユーザーとしてのリテラシー」です。
これは研究者など統計学を実用する人が修めるべき基礎教養を指します。初歩的な部分は Step 1と重複しますが、ここでは「統計モデルの背景理解」も必要です。意味がわかっていない統計モデルを自分の研究で使用することは難しい(あるいは危険である)からです。
研究者と言ってももちろん幅はありますが、実際に研究を実施する人であれば全員こうしたリテラシーが必要になります。最低限ある程度の知識がなければ、統計家はおろか同分野のシニア研究者と適切にディスカッションをすることもできないからです。
Step3:高度な専門ドメインのためのリテラシー
Step 3 は、Step 2 の内容をベースにした上で「より高度な専門性」を学ぶためのリテラシーです。
ここで想定しているのは、より専門的かつ最新のドメイン知識(たとえば疫学・生物統計・データベース処理など)を学習することです。要するに「その分野でプロになる」ために学ぶべきものを指していると考えてください。細分化された専門分野で修士〜博士を取得して現場に出ていくような人が学ぶ内容です。
ゴール設定を明確に
繰り返しになりますが、上記のうちまず自分がどのレベルの統計知識を身につけたいのかを明確にすることは非常に重要です。このゴール設定が曖昧なまま色々な書籍に手を出そうとすると挫折リスクが高くなります。
以下ではそれぞれのレベルについて掘り下げながら、どのように勉強していったらいいのか、私自身はどのように学んでいるかについて紹介してみたいと思います。
【Step 1】論文読者のためのリテラシー
まず Step1:「文献ユーザー(論文読者)のためのリテラシー」です。
この段階のゴールは、医学論文を批判的に吟味するための基礎知識を一通り身につけることです。解像度高く臨床研究論文を解釈することで目の前の患者さんの診療に活かすことが目標です。
医療現場で溢れる疑問
この薬(介入)は患者さんにとって本当に益があるのか?あるとしたらどの程度の益が見込めるか?本当にコストや害のリスクを上回るか?
医療現場ではいつも上記のような疑問があふれます。そしてこうした疑問をきちんと解決するには、最新の医学文献を参照し吟味することが必要です。ガイドラインは年単位で更新が遅れていきますし、UpToDate®︎ 等も全てを網羅してくれるわけではないからです。
しかしあらゆる医学論文では「科学の言語」として統計学の知識が随所に用いられており、その論文の強み・弱み(限界)を正しく理解するには、どうしても一定程度の統計リテラシーが必要になります。
論文の多くは手元のデータから一定の傾向を統計学的に "要約" ないし "推定" し、そこに著者らが解釈を加えたものであり、統計学とは切っても切り離せません。そのため統計的な解釈も含めた内容を批判的に吟味できなければ「この治療の何がよくてどこが限界なのか」を解像度高く理解できません。それではその領域のプロとは言えないでしょう。
「最新の治療の適否を自分の頭で判断できるようになる」というのがこの Step を学習する意味でありモチベーションであると言えます。
Step 1 学習の最適な時期
Step 1 の勉強を本格的に始める時期としては、臨床現場に出て 3〜4 年目あたりからが良いと思います。具体的には以下のタイミングです。
- 数年の勤務を経て、だいたい現場の仕事の流れはわかっている
- 一般的な診療パターン(ガイドラインの内容など)はだいたい知っている(耳学問でもよい)
- 患者さんの診療を主導していく立場になったとき
ここがベストだと言える理由は、端的に臨床疑問が自ずと溢れ出てくるようになるタイミングだからです。
- あれ?うちの施設では慣習的にこうしてきたけど、実はあまりエビデンスない?
- 調べてみたら、むしろ最近は不要ということになっている?
- この治療(介入)は目の前の患者にとって本当に有益なのか?
- 他の選択肢はないのか?リスクとのバランスはどの程度か?
……こうした疑問は数年の臨床経験を経ると必ず湧き出るようになります。これらの臨床疑問(=前景疑問)に答えようと思うと、最終的には臨床論文にあたるしかありません。そこで初めて、論文を批判的に吟味する必要性が本当の意味で心の底から腑に落ちるものだと思います。そのタイミングこそまさに批判的吟味の術(文献読者としてのリテラシー)を学習し始めるべき時期です。
扱う内容の例
以下はこのステップで対象となるような内容の一部を列記したものです。当サイトや動画でも解説しています(リンク先)。
- 臨床研究の吟味に必要な概念
- 研究デザイン(RCT・コホート・症例対照・SR/MA、前向き・後ろ向き)…
- GRADEアプローチ
- 主要エンドポイント・二次エンドポイント・post hoc 解析
- 複合エンドポイント、代用エンドポイント
- 仮説探索・仮説検証
- 研究デザイン(RCT・コホート・症例対照・SR/MA、前向き・後ろ向き)…
- 医療統計に特有の基本概念
- 記述統計の基本概念
- 推測統計の基本概念
- 標準偏差と標準誤差の違い(記述統計と推測統計の違い)
- 95%信頼区間とは何か
- αエラー・βエラー
- 多重比較・多重検定の問題とは何か
- power analysis とは何か
- サンプルサイズ設計はなぜ必要か
まずは「概念理解」を優先する
ここはあくまで Step1 ですから、まずは「基本的な概念理解」を優先します。数式は確実に私たちの理解を助けてくれますが、苦手意識の強い人は細かいところまで突っ込む必要はないと思います。
多くの人が "統計学" と聞いてイメージする小難しい数式の話は、ここでは必須ではありません。最低限、高校レベルの知識(平均値は何か、標準偏差とは何か)+α の基礎的内容は押さえておく必要はありますが、それ以上の数理的理解は Step. 2 以降に譲ってもよいと思います。
Step 1 といえど「簡単」ではない
なお Step 1 だからと言ってこの段階の学習が簡単というわけではありません。
加えてこのリテラシーがなくても臨床業務の実務上はほぼ問題にならないため、モチベーション維持も難しいかもしれません。論文を吟味できなくても UpToDate やガイドラインを押さえつつ指導者の言うことを聞いていれば 7 割以上の仕事は回っていくことでしょう。
しかしもし「プロであると自認したい専門領域」があるのであれば、その領域でプロを自称し続けるために、この段階の教養は身につけておきたいものです。やはり自分の専門領域の新薬データくらい、自分の頭で解釈できるようになりたいはずです。ぜひとも頑張って抑えていきましょう。
この段階でオススメな導入教材
医学論文の批判的吟味に関する書籍(うすい順)
- 臨床研究を正しく評価するには ―Dr.ファーバーグが教える26のポイント (Bengt D. Furberg)|非常に薄くすぐ読めるため批判的吟味の導入に最適.風刺画も多く読み物としても面白いです.
- やさしいエビデンスの読み方・使い方―臨床統計学からEBMの真実を読む (能登洋)|上記と同様に薄くエッセンスを網羅するのに適した良書.若干の思い出補正あり?
- 診療ガイドラインのためのGRADEシステム 第3版 (相原守夫)|研究の信頼性を「RCT>観察研究」のように単純なヒエラルキーで捉えず,きちんとそれぞれの質を評価しながら重みづけをするGRADE手法.本書で基本的な部分を学ぶことができます.
- Users’ Guides to the Medical Literature (Gordon Guyatt)|批判的吟味を学ぶ上で鉄板のTips集.6-10章の基礎項目だけでも一読の価値あり.一冊で済ませるならコレだけでOKです.
- 医学文献ユーザーズガイド 第3版|上記の邦訳版.残念ながらKindleがなく,重さは鈍器.
統計学の基本のキ(低負荷)
- 統計学が最強の学問である(西内啓)|統計の基本を分かりやすい語り口で紐解いて教えてくれる良書です.ビジネスマンや一般向けに書かれており非常に導入向きの一冊.Audible もあり通勤時間の耳からイケます.続編シリーズも併せてオススメ.
- 今日から使える医療統計 (新谷歩)|医療統計の基本のキに関してはやはり新谷先生(生物統計家)のシリーズが良いです.どの本も分かりやすいですが最初の一冊として薄く手に取りやすいのが本書.他にも多く書籍があるためここから進めていくことをオススメします.
- 分析者のためのデータ解釈学入門 データの本質をとらえる技術(江崎貴裕)|非常に美麗なイラストでわかりやすく統計モデルの基本を教えてくれる良書.STEP2 段階の導入にも良い書籍です.
- エレベータのブザーは鳴るか―大学生のための統計学入門(京都大)|無料公開が太っ腹すぎる満足度の高い講義
【Step 2】統計を実用するためのリテラシー
Step 2 は「統計ユーザー」すなわち研究で統計学を実用する人たちに必要なリテラシーです。
- この研究ではどのような統計手法・モデルが適切か?
- この検定・このモデルの前提は何か?自分のデータは満たしているか?
研究を実施するとなったとき、こうした実務的な疑問は次々に湧いてくるものです。
しかし上記の内容にきちんと答えようとすると、数理的な背景理解も一定程度必要になります。
特に医療分野の研究者であれば、医療分野で頻出の解析方法(Cox比例ハザードモデルによる生存時間分析やロジスティック回帰など)はそのモデルの前提条件なども含めて理解しておかなければなりません。
最終的には統計のプロに相談すればいいわけですが、統計のプロと共通言語でディスカッションするための最低限のレベルは押さえておきたいものです。それがまさに Step2 のコンセプトです。
Step 2 学習の最適な時期
学習開始の分かりやすいタイミングは当然「自ら研究を実施する前」です。
ただこの領域の統計知識は学び始めるとキリがないところでもあります。理想的には医学分野で使用頻度の高い全ての統計モデルについて数理学的な背景も含めて知悉することですが、実際は必要時に都度勉強していくのが現実的なところかと思います。特に臨床キャリアも継続している人がここで完璧を求めすぎてしまうと学ぶべき量に圧倒されて足が止まってしまうかもしれません。
最終ゴールが「研究すること・論文を書くこと」なのであれば、メンターや生物統計家の先生がたに助けてもらいながらそのプロジェクトを進めていくことこそ優先すべきです。統計の勉強は大変重要ですが、実際に研究の中で統計ソフトをイジイジしながらオンザジョブで覚えていくしかない部分も相当程度あると思います。
まずは大学院に入ったり、実績のある研究ワークショップに参加し頼れるコミュニティを見つけることが先決です。その上で必要なものから順に身につけていくのが現実的な所ではないでしょうか。実際その方が勉強も捗るかと思います。
この段階でオススメな導入教材
数理統計の基本のキ 〜STEP1と2の中間〜
- 完全独習 統計学入門(小島 寛之)|中学数学で「検定」や「区間推定」まで,というコンセプトの入門書.数理統計の最初の一歩に適した一冊です.ベイズ統計の入門書も同じ著者・出版社から出ておりそちらもオススメです.
- よくわかる心理統計 (山田剛史, 村井潤一郎)|t検定など基本的な数理的概念を学ぶ導入の一冊に最適.心理統計とありますが入門レベルなので医療統計と完全に重複します.心理学で文系読者を想定しているためか数式の補助が非常に適度です.下手に言葉だけで説明しようとする書籍よりも分かりやすいです.
- 高校数学でわかる統計学―本格的に理解するために (ブルーバックス)|しっかりと数式から入る統計学の導入本ですが,分厚すぎず「よくわかる心理統計」の後であればすんなりと読み進められ理解も深まります.
研究者のための入門教材
- Designing Clinical Research 5th Edition|タイトル通りどう臨床研究をデザインすべきかを扱う一冊.臨床研究者には欠かせない鉄板の教科書です.最新の邦訳が2024.9に出ました(↓)が,原著はKindle版があり持ち運びがラクなのでオススメです.
- 医学的研究のデザイン 第5版|上記の邦訳版.例によって邦訳はKindle版がありません.
- Rによるやさしい統計学(山田剛史, 杉澤武俊, 村井潤一郎)|”よくわかる心理統計” と同じ著者陣が送る言わずと知れた名著.Rと同時に統計も学べるという,あまりにもお得すぎる一冊.
- 疫学のためのRハンドブック:言わずと知れたリファレンスマニュアル.
- R programming A-Z™️ (@Udemy)|Rの基本操作〜ggplot2 の実用解説など.結局 ChatGPT だけで綺麗なグラフを作るのは限界があるのでこの手の学習は欠かせません.Udemyは時々9割引など意味不明なセールをしているので安売りタイミングを目指しましょう.他にもUdemy教材は豊富なので色々漁ってみることをオススメします.
- 聴講コース 臨床研究者のための生物統計学(京都大)|またしても無料公開が太っ腹すぎる京大の講義.臨床研究を行う人は必見です.
【Step 3】高度な専門ドメインのためのリテラシー
最後に Step 3 です。ただこれは書いてはみたものの、私自身あまり解像度高く認識できている領域ではありません。
Step 2 が「研究実施者なら全員が学ぶ(べき)共通の前提知識」だとすれば、Step 3 は「研究チーム全員がわかっている必要はない知識」という位置付けです。やはり生物統計家など専門領域の人と分業すべきところは分業すべきだと思います。
もちろん Step 2 と 3 の境界は研究ジャンルによってもある程度幅があると思いますし、どこかでバツンと隔絶があるというよりは、グラデーションのように移行していくものではないかと認識しています。
重要なのは研究実施者たちが「きちんと "分からないことをわかったうえで" プロの先生方にコンサルトできるようになる」ことだと思います。
Step 3 学習の適切な時期
というわけで、このクラスの知識の勉強について私は語れることがありません。
そもそも臨床家ベースの人が統計を学ぶ場合、基本的にこのクラスの知識を極める必要はありません。この先は「キャリアの中で必要なもの」ではなく「わからないことをわかっておくべき領域」だと思います。
餅は餅屋であって、臨床家のバックグラウンドはあくまで臨床です。臨床のプロが統計のプロにまでなろうとする必要はありません。臨床のプロには臨床のプロにしかわからないドメイン知識があるはずで、そこをうまく統計家と相談できる素地を身につけることにまず重点をおくべきです。混み入った統計解析の仔細については生物統計家などプロにコンサルトすればよいわけです。
ですから臨床がベースの(研究もする)人にとっては「統計家とのコミュニケーションが円滑に可能になる」程度の背景知識(=Step2)をマスターすることがある種のゴールになると思います。
しかしそれでも尚極めたい勇者のかたがたは、もちろん勉強していただきたいと思います。おそらくその先のキャリアは普通の臨床家・臨床医ではないでしょう。ぜひハイブリッド人材になって、日本の医療を救ってください。 さっそく専門性の高い教育機関へアプライして頂けたらと思います。敬意を表します。
参考になりそうな教材
より専門的な学習へ
- なお MPH や PhD コースにアプライする前に,ネットで教材を探してみるのもアリだと思います.基本的に英語にはなりますが,最近は色々な教材が Udemy やYoutube,Cousera,EdX といったプラットフォームに沢山転がっています.私も十分目を通しているわけではありませんがネットで見かけた有用そうな教材を貼り付けておきます.
- Statistical Rethinking|同タイトルの応用ベイズ統計に関する名著の著者の一連の講義が Youtubeで全て聞けます.講義スライドもCC0-1とかなり緩い著作保護で Githubに公開中.イっイケメンすぎる…
- HarvardX: Data Science: R Basics
- HarvardX: Causal Diagrams: Draw Your Assumptions Before Your Conclusions|いわゆるDAG関連講義
まとめ
- Step 1:文献ユーザー(=読者)のためのリテラシー
- Step 2:統計ユーザー(=研究者)のためのリテラシー
- Step 3:より高度な専門ドメインのためのリテラシー
このステップ1〜3のレベルに合わせて教材を選択し少しずつ学習を進めていくのが臨床など別のキャリアを背景にした人の統計の学び方としては良いのではないかと思っています。
尚この記事では導入向けの教材に絞って紹介しましたが、もう少し踏み込んだものを含めると他にも沢山の素晴らしい書籍があります。いずれ全てのレビューをしたいという野望もありますが、いつ実現するのかは分かりません😅
読者の皆様のご意見やおすすめの書籍についても教えていただけたら嬉しいです。それではまた!