オッズとは何か?オッズ比とリスク比の違い|やわらか統計学

クロ

この記事では「オッズとは何か」についてまとめるぞ!

ミケ

「オッズ比」と「リスク比」の違いについても解説します
いきなりまとめ:本項のポイント

  • オッズは〈比〉;あらゆる研究で定義される
  • リスクは〈割合〉;前向きに「追跡される集団」がなければ定義できない
  • リスク比は「X倍」と言ってもそのまま意味が通る
  • オッズ比は〈比の比〉であり,「X倍」と言っても直感的に解釈できない

オッズとは何か

オッズ(Odds)には「見込み」「勝算」などの訳がついています。

しかし本質的な定義を述べると,オッズとは,確率の〈比〉です。

数学的には,ある現象が起きる確率 p と,起きない確率 1-p の〈比 ratio〉として表されます(▼)。

$$ Odds = \frac{p}{1-p} $$

ただ,数式をいきなり出されてもあまりピンときませんよね。

以下では実際の例をみながら解説していきます。

オッズの意味

オッズは比

美女を二人 ── たとえば北川景子と石原さとみの二人を思い浮かべてください。このとき,学校の同級生 100人に「どちらがより好みか」を尋ねます。

仮に 60 人が北川景子を選び,40人が石原さとみを選んだとしましょう。

この場合,

ウチの学校では北川景子の方が石原さとみよりも 1.5 倍好まれている

という結論になりますよね。

実はこれも立派なオッズです。言い換えれば これは,

本校では北川景子の方が石原さとみよりも人気のオッズが 1.5 である

ということです。

北川景子が選ばれる確率(p = 0.60)と,北川景子が選ばれない確率(1-p = 0.40)の比が,1.5 であるということです。

─ ads ─

オッズは2つのものの「比較」に適する

このとき

本校では北川景子を好む人が 60%, 石原さとみを好む人が 40% である

と〈割合〉を示しても良いのですが,直接「1.5 倍人気」と言ってしまった方が,どちらがより高い人気であるのかを伝えやすい印象があると思います。

それは当初の目的が「両者の比較」というところにフォーカスされていたからです。

こういう場合には,人気の〈割合〉を提示するよりも,〈比〉(=オッズ)を提示することが適しています。

ギャンブルでのオッズ

Gamble

もう少し別の例も見てみましょう。

「オッズ」という言葉を日常生活でも目にすることがあるのは,やはり賭け事の世界でしょう。

ギャンブルではオッズが非常に大切な指標になります。その賭け事で勝利したとき,どれほどの払い戻しがあるかを端的に示してくれる指標だからです。

例えば,5 回に 1 回の勝率(つまり p=0.2)というものは,勝利のオッズで示すと

$$\frac{p}{1-p} = \frac{0.2}{1 − 0.2} = 0.25 $$

となります。

この勝利オッズが低いほど,その事象が起きた場合の儲けが大きくなるわけです。

具体的には,勝利オッズ 0.25 のものに 1万円 を賭けておくと,もし「当たり」を引き当てた場合には 1万円 ÷ 0.25 = 4万円 を受け取ることになるのです。

賭け金も帰ってきますので,実質 5 倍です。ハイリスク = ハイリターン となるのが賭け事の世界ですね。

ただし現実には,賭け事の胴元が手数料などを差し引きます。

なお余談ですが,こうした賭け事の状況でオッズを表現する際には,賭博場によって,いろいろな表記パターンがあるようです(▼)。

勝利オッズ 0.25 のとき:賭け事でのオッズの表現法

  • 原義に忠実 ── 4:1,または 4/1
  • もとの掛け金も加えた記載 ── 5.0 または 5 for 1
  • 掛け金100に対する儲け ── +400
オッズの語源は “Odd” ですが,これは数学用語では「奇数」を意味します。いっぽう,数学用語で「偶数」は “Even” です。また,Even には「五分五分である」という意味もあります。そして,五分五分 even ということは,50:50,つまり オッズ = 1 と言うことです。五分五分でない状況が,オッズに意味がある状況,という風にも言えるかもしれません。なお,Odd という英単語は「奇妙な」 という形容詞でもありますが,ある意味これも「even ではない」ということかもしれません。

オッズとリスク

さて,ここからが本題です。

ギャンブルはさておき,統計や科学の世界でもオッズというものは非常に大事な指標です。

そしてこのとき,類似概念であるリスクとオッズの違いについてよく理解しておかなければなりません。

オッズもリスクも「その現象の起こりやすさ」を示す指標

という点では同じです。

しかし,この2つは「分母がちがう」ため,数学的には全く異なる概念です。これを混同してしまうと,大きな誤解を招きかねません。

まずはリスクとオッズの定義について,改めて確認していきましょう。

リスクとは何か

リスクとは,その名の通り「危険性」です。

「病気を発症」しやすいどうか,「死亡」しやすいかどうか,など,負のイベントの起きやすさを検討する際に用いることが多いものです。

リスク (Risk) とは?

  • 発症リスク = 追跡・観察した対象群の中で,発症者が占める〈割合〉
  • 〈割合〉なので 0~1 (0%〜100%)の値しか取らない

オッズとは何か

オッズは,先述したように〈比〉です。

とくに医療統計の分野においては,「あるイベントが起きる確率」と「起きない確率」の〈比〉を示します。

オッズ(Odds)とは?

  • 発症オッズ = 発症確率と発症しない確率の〈比〉
  • 〈比〉なので,0 ~ ∞ の値を取る

オッズとリスクの違い

要するに両者の最大の違いは,

オッズは〈比 ratio〉で,リスクは〈割合 proportion〉

ということです(▼)。

■オッズとリスクの違いの模式図:Risk and odds

オッズ比 と リスク比

ここで具体的な オッズ・リスク の算出に入る前に,オッズ,リスクについても述べておきます。

これらの定義は文字通りです(▼)。

リスク比(risk ratio):ある群でのリスクと他の群でのリスクの比
オッズ比(odds ratio):ある群でのオッズと他の群でのオッズの比

重要なのはオッズ・リスクの「変化量」

「ある集団における発症リスク(や発症オッズ)」は,疫学的には重要な指標です。

しかし,それはあくまで〈特定の標本集団〉における生データについて記述したものに過ぎません。

こうした研究を記述疫学と呼びます。

一方,なんらかの介入や要因曝露によって「どの程度の益や害があるのか」という〈効果の推定〉には,オッズやリスクの変化量の比較、、、、、、の方が重要となります。

ある特定の介入あるいは要因曝露の有無によって,どれほど発症オッズや発症リスクが変化するか

という情報が,まさしく〈効果〉の推定のために必要となるのです。

オッズ比・リスク比は効果判定に用いる

要するに,

その「危険因子」はどれほどの「害」なのか?

その「治療介入」はどれほどの「益」なのか?

といったことを定量化するために,

  • 「対照群における発症オッズ」と「曝露群における発症オッズ」の比
    オッズ比 OR; Odds Ratio
  • 「対照群における発症リスク」と「曝露群における発症リスク」の比
    リスク比 RR; Risk Ratio

がどのくらいになっているかを見る,ということです。

リスク比 risk ratio は,相対リスク relative risk とも表現されます。また,オッズ比 odds ratio は相対オッズ relative odds と呼ぶこともあります。

オッズとリスクの使い分け

では,同じような指標である「オッズ」と「リスク」は,そのどちらを使った方がよいのでしょうか。

それは,私たちが「どのような点に関心を持っているか」ということによって異なります。

先述したように,

ある1つの事象に特に関心がある場合はリスクがよく,
両者(の比)に関心がある場合はオッズがよい

と言えます。

「死亡リスク」か「死亡オッズ」か

例えば「エボラ出血熱を罹患すると,そのうちの半数(の割合)が死亡する」という場合について考えてみましょう。

このとき,死亡のリスクは 0.5(50%)ですが,死亡のオッズは,50:50 ですので,つまり1と言うことになります。

このときは「死亡オッズ = 1」と言われるより「死亡リスク = 0.5 (50%)」と言われた方がしっくり理解できると思います。

これは「死亡というイベントそのもの」への関心があり,死亡と生存の〈比〉にはあまり関心がないからです。

逆に,「賛否」や「好き嫌い」「男女比」「人気投票」のように,両者の対比に関心があるときは,オッズ(比)のほうがわかりやすいというわけです。

|補足:割合と確率
なお,このとき死亡リスクは50%の「確率」というようにも捉えられるのですが,実際には「ある国のエボラ出血熱の罹患者は,そのうち50%(の割合)が死亡した」といった疫学的データに由来するものです。ですからリスクは「割合」でもあり「確率」でもあるのです。当然ながら医療制度や医療レベルによって,同一疾患でも死亡リスクは異なる値になります。

本当はリスクの方が知りたい

では,医学論文などで〈比〉(=オッズ)それ自体を特別に知りたいシチュエーションはあるのでしょうか?

たとえば死亡なら,先述したように,死亡リスク(確率)が知りたいわけで,特別に「死亡確率と生存確率の比(= 死亡オッズ)」そのものを知りたいという状況は滅多になさそうです。

疾患発症や副作用発症といった「イベントが起きる確率」についても同様です。

「イベント発生確率とイベントが発生しない確率の〈比〉」(=オッズ)それ自体に興味を抱くことはほとんどないのではないでしょうか。

こうした状況では,実際のところ「発症確率(リスク)」それ自体が気になるはずです。

そもそも,医学をはじめとする科学のシチュエーションでは本来,

リスクの方が,オッズよりも直感的理解がしやすい

ことは明白です。

じゃあオッズって要るの??

という気持ちになってしまいそうですが,実際には,科学論文ではむしろリスクよりもオッズの方を見かけることが多くなっています。

直感的な解釈ができないオッズが,こうも頻用される理由はいったい何なのでしょうか。

個々の点ついては後ほど取り上げますが,その回答の際たるものは,

リスクは算出できない場面があるが,オッズはいつでも算出できる

というものかもしれません。

リスクは前向き研究でしか算出できませんが,オッズはどのような研究方式であっても算出することができるため汎用性が高いのです。

オッズは前向きでも後ろ向きでも計算可能

Xrok

リスクとは,「ある人数の集団の中で何人が(不幸な)イベントを起こすか」という〈割合 proportion〉ひいては確率を表すものです。

ですから,大前提として〈観測・追跡される集団〉がなければリスクは算出できません(▼)。

$$\text{発症リスク(割合)} =\frac{\text{イベントを起こした人数} }{\text{観測・追跡された集団の全人数} } $$
つまり〈コホート研究〉や〈ランダム化比較試験〉といった,前向きの縦断研究 prospective longitudinal studies でしか求められない,ということです。〈症例対照研究〉のような後ろ向き研究や,ある時点での調査を行う〈横断研究 cross-sectional studies〉では,発症リスクは算出できないのです。

しかし,オッズであれば,前向き研究でも後ろ向き研究でも計算することが可能です。

以下では実際に,前向き研究と後ろ向き研究におけるリスク・オッズの算出過程をみてみましょう。

前向き研究でのオッズとリスク

いま,以下のような研究を行なった場面を想像してください(▼)。

【前向き研究】
同年代で喫煙習慣のある人と,喫煙習慣のない人を,それぞれ50人ずつ集めて,25年間追跡するという前向き調査を行った

小規模な〈前向きコホート研究〉に分類されます

この合計 100 人のうち,何名かは発癌することが見込まれるわけですが,喫煙者の方が喫煙していない人と比べて どのくらい、、、、、 発癌しやすいのか,という点を調査するわけです。

このとき,喫煙していた 50 人のうち 16 人が発癌してしまい,喫煙していなかった 50 人からは 4 人しか発癌しませんでした。

つまり,以下のようなデータ(▼)が得られたとします。

【結果】喫煙者と非喫煙者 50人ずつを追跡した

発癌した (outcome+)発癌しなかった (outcome-)合計
喫煙あり163450
喫煙なし44650
合計2080100

発癌リスクの比は?

このとき,喫煙による発癌リスクの増加はどの程度でしょうか?

ここでは 50 人ずつ計 100 人という〈観測・追跡された集団〉がありますので,発癌リスク(発癌した人の割合)を直接算出することができます。

喫煙あり群の発癌リスク: 16/50 = 0.32(32%)
喫煙なし群の発癌リスク: 4/50 = 0.08 (8%)


リスク比 risk ratio: 0.32 ÷ 0.08 = 4

つまり,直感的にわかるように,喫煙によって発癌のリスクは 4 倍になる,ということが言えます。

発癌オッズの比は?

では,このとき「発癌オッズ」はどうなっているでしょうか。

発癌オッズ = 発癌する確率/発癌しない確率

という〈比〉ですから,以下のように計算できます。

【結果】喫煙者と非喫煙者 50人ずつを追跡した

発癌した (outcome+)発癌しなかった (outcome-)合計
喫煙あり163450
喫煙なし44650
合計2080100
喫煙あり群の発癌オッズ:16/50 ÷ 34/50 = 16/34 = 0.47
喫煙なし群の発癌オッズ:4/50 ÷ 46/50 = 4/46 = 0.087


オッズ比 odds ratio: 16/34 ÷ 4/46 = (16×46)/(34×4) = 5.4

つまり,喫煙によって発癌のオッズは 5.4 倍になる,ということです。

この時,オッズは「発癌する確率/発癌しない確率」という〈比〉であり,オッズ比は「さらにそれらの比」であることに留意してください。

オッズ比とリスク比

つまり今回のデータからは,喫煙で発癌リスクは 4 倍になり,発癌オッズは 5.4 倍になるということが言えそうです。

なお,このように

オッズ比の方がリスク比よりも数字が派手になる

ことが知られています。

ここで気をつけなければならないのは,オッズとリスクを混同しないことです。

間違っても オッズ比 5.4 という結果を見て「リスクが 5.4 倍になります!」と言ってはいけません。

私たちが直感的に「確率」として理解できるのはリスクの方です。「●●倍です!」と言われて,そのまま解釈できるのも,リスク比だけです。

オッズ比は〈比の比〉

オッズはそもそも〈確率の比〉です。ですから,オッズはオッズ(=比)の比,つまり〈比の比〉です。

オッズ比がいくつだからと言って,その数字の意味するところを直感的に理解することは不可能です。

「X 倍になりました!」といって意味が通るのは,リスク比の方なのです。

【下記の例で間違ってもリスク 21倍!と言ってはいけない】
OR and RR

▲ 危険因子への曝露によって,発癌リスクが 9 倍,発癌オッズは 21 倍になっている
マスメディアもしばしばオッズとリスクを混同した報道を行っています。誇張のため確信的におこなっている場合もあるかもしれません。情報の受け取り手が気をつけなければならないポイントの1つです。

後ろ向き研究はオッズのみ

続いて,後ろ向き研究を考えてみましょう。以下のような研究をイメージしてみてください(▼)。

【後ろ向き研究】
ある病院である月に「がん」と診断された人 20人 と,同じ病院の同じ月に「がん」ではない病気の診断を受けた 80人 について,これまでの喫煙歴を調査。

〈症例対照研究 case-control study〉に分類されます

この研究では,がん患者さん(case)は 20人中16人も喫煙歴があったことが判明し,がんではない疾患だった人(control)の80人のうち,喫煙歴があったのは34人でした。

つまり以下のようなデータが得られたとします。

【結果】がん患者と非がん患者の過去の喫煙歴を調査

がん患者 (case)がんでない患者 (control)
喫煙歴あり1634
喫煙歴なし446
合計2080

発症リスクは算出不能

実はこのデータの中身の数字は,先ほどの前向き研究のものと全く同じ内容になっています。

しかし決定的な違いとして,ここでの100人(20人 + 80人)は〈追跡・観測された集団〉ではない,ということが重要です。

まずがんと診断された case が 20 人いて,それと同時期に別の病気の診断を受けた同年代の 80 人ほどのデータを研究者が集めてきただけです。適当にみつくろってきただけです。

ですから,発症リスク(=発症者の割合)はここでは算出できません。

発症者の割合を算出しようにも,分母にあたる〈追跡された集団の全体数〉が存在しないからです(▼)。

$$\text{発症リスク(割合)} =\frac{\text{イベントを起こした人数} }{\text{観測・追跡された集団の全人数} } $$

この研究では 20人の case と 80人の control を集めていますが,その合算(全体数)である “100” に意味があるかと言えば,ありません。この集団の中での発症リスクは 20/100 です!と言われても,意味が通らないのです。

つまりこのケースでは,喫煙者における発癌リスク(割合)も,非喫煙者における発癌リスク(割合)も不明です。

|補足:行と列
先ほどの例は前向き研究でしたので,「行」方向のデータに「実質的意味」がありましたが,今回のデータは「列」方向にしか実質的意味がない,ということです。

発症オッズも算出不能

以上から,この研究では以下の項目がすべて算出できません(▼)。

【後ろ向き研究では,以下は全て求められない】

  • 喫煙者における発癌リスク = ?
  • 非喫煙者における発癌リスク = ?

  • 喫煙者における発癌オッズ = 発癌する確率(?) / 発癌しない確率(?)
  • 非喫煙者における発癌オッズ = 発癌する確率(?) / 発癌しない確率(?)

ここで,〈発癌リスク〉と同様,〈発癌オッズ〉も算出できないことに注意してください。

えっ,じゃあオッズ比も計算できない?

と思ってしまいますが,そうではありません。

この場合でも〈オッズ比〉を計算することは可能です。

とは言え先述したように「喫煙者における発癌オッズ」と「非喫煙者における発癌オッズ」はわかりませんから,その〈比〉は求められません。

ではどうやって計算するのか?

後ろ向き研究で計算するのは,「発症者が喫煙(という因子)に曝露していたオッズ」と「非発症者が喫煙(という因子)に曝露していたオッズの〈比〉なのです。

横断研究 cross-sectional study でも同様です。

これなら,手元のデータからそのまま求めることができます。

要因に曝露していたオッズを比較する

実際に計算してみましょう。

【結果】がん患者と非がん患者の過去の喫煙歴を調査

がん患者 (case)がんでない患者 (control)
喫煙歴あり1634
喫煙歴なし446
合計2080
癌患者が喫煙に「曝露した確率」の比(オッズ) = 16/20 ÷ 4/20 = 16/4 = 4.0
非癌患者が喫煙に「曝露した確率」の比(オッズ) = 34/80 ÷ 46/80 = 34/46 = 0.74


上記のオッズ比 = 16/4 ÷ 34/46 = (16×46)/(34×4) = 5.4

ここで出てきた「オッズ比 5.4」は,先程の前向き研究の例と同値になっています。

これこそが「オッズ比」の強みの1つです。

行方向に計算しても列方向に計算しても同じ

つまり,

  • 前向き研究のデータで「行方向に」直接「発症オッズ」を算出してその〈オッズ比〉を算出した場合
  • 後ろ向き研究のデータで「列方向に」「曝露オッズ」を算出してその〈オッズ比〉を出した場合

で,最終的な計算式が全く同じになる のです。

これは,オッズ比が〈比の比〉だからこそ為せる技です。

列方向からでも行方向からでも,オッズ比は全く同じ「たすきがけ」の数式で算出されるのです(▼)。

行からでも列からでもオッズ比は算出可

発症あり発症なし
曝露ありAB
曝露なしCD
  • 曝露あり群の〈発症オッズ〉 A/B(前向き研究でのみ算出可)
  • 曝露なし群の〈発症オッズ〉C/D(前向き研究でのみ算出可)
  • 発症あり群の〈曝露オッズ〉A/C(後ろ向き・横断研究でも算出可)
  • 発症なし群の〈曝露オッズ〉B/D(後ろ向き ・横断研究でも算出可)

  • 〈発症オッズ〉の〈比〉=(A/B ÷ C/D)= AD/BC
  • 〈曝露オッズ〉の〈比〉=(A/C ÷ B/D)= AD/BC

★ 発症オッズの比 = 曝露オッズの比(数式上)

いわゆる「たすき掛け計算」になっています

曝露オッズの比 = 発症オッズの比

繰り返しになりますが,後ろ向き研究では〈発症リスク〉も〈発症オッズ〉も,決して算出することができません。

計算しようとしても,「みつくろってくる対照群のデータの数」によって,それらの数字はコロコロと変わってしまいます。全く意味のない数字です。

しかし〈曝露オッズ〉やその〈比〉は算出することが可能です。

そしてそれは,前向き研究データで得られる〈発症オッズ〉の〈比〉と数学的に同一のものとなるのです。

曝露オッズの比 = 発症オッズの比 (数式上)
補足
なおここで「数式上」と但し書きをするのは,やはり「前向きデータで得られたオッズ比」と「後ろ向きデータで得られたオッズ比」を完全に同一視することは難しいからです。そもそも前者は〈発症オッズ〉の〈比〉になっていますが,後者は〈曝露オッズ〉の〈比〉であることは先述した通りです。例えばオッズ比が 10 の時,前向き研究で得られるオッズ比であれば「喫煙していたことで発症オッズが 10 倍になった」という前向きの相関関係を意味します。しかし,後ろ向き研究で得られるオッズ比が 10 だった場合,それは「発癌した人は喫煙への曝露オッズが 10 倍高かった」という後ろ向きの意味になります。数学的には同一のものでも,前向きのデータから得られたオッズ比と後ろ向きのデータから得られたオッズ比は,やはり素性が異なるのです。しかし,やはり数学的には同一の〈比の比〉なので,異なる研究間でもある程度,比較可能とされています。オッズ比がリスク比よりも研究間での汎用性が高い指標であることは間違いありません。

ミケ

後ろ向き研究でも前向き研究でも「オッズ比」は同一指標として扱うことができる。だから幅広く比較検討がしやすい,という点で研究者に好まれる指標なのね。

クロ

データとしての汎用性が高いということだな!

その他のオッズの特徴

オッズが広く用いられる理由としては,他にも以下のような理由が挙げられます。

  1. まれな現象の場合,オッズはリスクに近似できる
  2. 数学的な汎用性が高い
  3. ロジスティック回帰分析で用いる

順に見ていきましょう。

特長①:発症がまれな場合,オッズはリスクに近似する

Calc

オッズに関する重要なポイントとして,リスクが十分小さい時,オッズとリスクはほぼ同じ値になる,ということが挙げられます。

このことは数式から容易に推定できますので,実際に計算してみましょう。

最初にお示ししたように,

発症オッズ = 発症確率/発症しない確率

ですが,ここで「発症確率」は「発症リスク p」とも言い換えられます。

つまり

$$ 発症オッズ = \frac{発症リスク}{1-発症リスク} = \frac{p}{1-p} $$

$$ 発症リスク = \frac{発症オッズ}{1+発症オッズ} $$

と示すことができます。

ここで,例えば発症リスクが 1% 程度,つまり p = 0.01 の場合を想定してみましょう。
そうすると,上記式より,

$$ 発症 Odds = \frac {0.01}{1-0.01} = \frac {0.01}{0.99} ≒ 0.01 $$

となります。

発症オッズは,発症リスク(0.01)とほとんど同じ値になっています。

|数式の補足
発症あり発症なし
曝露ありAB
曝露なしCD
  • 曝露あり群における発症オッズ = A/B
  • 曝露なし群における発症オッズ = C/D
  • 曝露あり群における発症リスク = A/(A+B)
  • 曝露なし群における発症リスク = C/(C+D)

  • まれな疾患では,発症あり <<< 発症なし
  • つまり A+B ≒ B,C+D ≒ D
  • この時,曝露あり群の発症リスク A/(A+B) ≒ A/B (= 発症オッズ)
  • この時,曝露なし群の発症リスク C/(C+D) ≒ C/D (= 発症オッズ)

オッズ “比” もリスク “比” に近似する

稀なイベントの場合,近似できるのは,オッズとリスクだけではありません。

同様に,オッズも,リスクと近似することができます。

|数式の補足
発症あり発症なし
曝露ありAB
曝露なしCD
  • 曝露あり群における発症リスク = A/(A+B)
  • 曝露なし群における発症リスク = C/(C+D)

  • \( 発症リスク比 = \frac{A(C+D)}{C(A+B)} \)
  • \( 発症オッズ比 = \frac{AD}{BC} \)

  • まれな疾患では,発症あり <<< 発症なし
  • つまり A+B ≒ B,C+D ≒ D
  • これを発症リスク比の式に代入すると,発症リスク比≒ 発症オッズ比

オッズ比も直感的解釈が可能に

オッズ比がリスク比に近似できるのであれば,オッズ比の「直感的に解釈することができない」という最大の欠点が克服されるため,非常に大きい益があります。

ただし,稀ではない現象を対象とする場合,オッズ比とリスク比は大きくズレてしまうので注意が必要です(下図参照▼)。

オッズ比とリスク比の換算グラフ

図から,発症者割合が 0.01(=1%)程度であれば,オッズ比とリスク比のズレは小さいことがわかります。しかし発症割合が0.25(=25 %)にもなると,そうはいきません。オッズ比が大きくなるほどリスク比からのズレも大きくなっていき,オッズ比 15 の時,リスク比はたったの 4 (!) です。このように,発症者割合が増えるほど,またオッズ比の値が大きくなるほど,リスク比とオッズ比の数字的な乖離は大きくなっていきます。そのような時に「オッズ比 XX」を「リスクが XX 倍!」と混同すると,大変な誇張を生みます。

発症が稀なイベントは,症例が集まりにくく,ランダム化比較試験やコホート研究のような前向き試験で頑健なエビデンスを示すことは困難です。

しかしそのように稀なものであれば,〈オッズ比〉が〈リスク比〉と近似できるため,〈症例対照研究〉の様な後ろ向き研究と相性が良いと言えます。

オッズ比とリスク比の順位性

また,上図から明らかなように,どのようなパターンであってもオッズ比とリスク比は「正の相関関係」をもちます。

リスク比が大きい時,オッズ比も大きくなり
リスク比が小さい時,オッズ比も小さくなる

ということです。

単調増加の関係性であるため,順位も変わりません。これも有用な点の1つです。

たとえば,種々の危険因子への曝露と発癌リスクの関連性を検討する前向きのコホート研究があったとします。

結果として,①喫煙,②飲酒,③運動習慣がないことによる発癌オッズ比(OR)が,順に 5,3,2 となったとします。

このオッズ比の「値それ自体」を直接解釈することが不可能であることは,先述した通りです。

しかし,オッズ比の順位はリスク比の順位と変わりません。

たとえばこの時「発癌リスク比(RR)」を正しく計算すると,順に 2倍,1.5 倍,1.2 倍となっているかもしれませんが,順位についてはオッズ比と合致します。

つまり,この例で言えば,①②③のうち最も大きな影響があるのは「①喫煙」である,ということまでは,後ろ向き研究で算出したオッズ比の順位から証明することができます。

発症者の割合に関わらず,オッズ比の順位性 = リスク比の順位性なのです。

リスク比とオッズ比の関係性まとめ

  • 発症者の割合が低い時:発症オッズ比 ≒ 発症リスク比
  • 発症者の割合が高い時:発症オッズ比 >> 発症リスク比
  • 発症者の割合に関わらず:オッズ比の順位性 = リスク比の順位性

特長②:数学的な安定性

数学的な安定性が高いことも,研究でオッズが好まれる理由の1つです。

と言われてもあまりに抽象的でピンとこないかもしれませんが,やはり「分母に分子が含まれない」というのが強みです。

「前向き研究でも後ろ向き研究でも横断研究でも同じように扱える」というのも,言うなればこの「数学的安定性」によるものと言えます。

また,オッズはただの比ですから,分子 と分母 を反対にしても解釈が可能です。これも便利な点の1つです。

分子と分母を逆にしても意味が通る

たとえば 100人のがん患者を追跡したところ,5年以内に死亡した人の割合は 75% ,生存した人の割合 25% の 3倍 であったとします。

この時,そのがんによる 死亡オッズ = 3 ですが,別の観点で言えば,そのがんによる生存オッズ = 1/3 とも言えます。

オッズはただの比ですから,逆数でもそのまま意味を持つのです。

一方,リスクは割合ですから,分子が分母に含まれます。死亡リスク = 0.75 ということは,100人全員の中で死亡してしまった人の割合が75% ということであり,数学的には分子と分母を逆にしても全く意味が通りません。逆のリスク(この場合,生存リスク)を求めるには,「1から引く」ことになります。

特長③ ロジスティック回帰分析で用いる

ロジスティック回帰分析 logistic regression,という言葉を聞いたことがあるでしょうか。

ここでの細かい説明は割愛しますが,ロジスティック回帰分析は,あるイベントが起きる確率 p が下記の数式(▼)に従って求められる(下記の数式に値を代入すれば p の予測値が得られる)という,モデル化方法のことです。

$$ p = \frac{1}{1+ \exp (-(a_1x_1+a_2x_2+ \cdots + a_nx_n + b) ) } $$
この様に,一定の数式モデルに当てはめて目的の数値を算出することを,一般に(非線形)回帰分析と呼びます。ロジスティック回帰はその一種です。

この数式を変形すると,

$$ \frac{p}{1-p} = \exp(a_1x_1 + a_2x_2 + \cdots + a_nx_n + b) $$

あるいは \( \log \frac{p}{1-p} =a_{1}x_{1}+a_{2}x_{2}+\ldots +a_{n}x_{n}+b \)

となります。

この式の左辺は,オッズそのものですよね。

ロジスティック回帰分析は医療統計で非常に多用される統計解析方法の一種で,前向き研究でも後ろ向き研究でも用いられます。

オッズが統計を用いた論文で頻用される理由の1つは,このロジスティック回帰分析との兼ね合いもあるのです。

この辺りは非常に混み入った話になるので,また別項で扱いたい内容です。

終わりに:時間の概念を含むには?

Clocks

オッズとリスクの説明は以上で概ね終了です。

しかし最後に,この2つの指標が持つ大きな欠点について言及させて頂きたいと思います。

それはすなわち,

リスクもオッズも,時間的要素を無視した概念である

ということです。

複数回おこすイベントには対応できない

例えば,年に2回 イベントを起こす人は,年に1回イベントを起こす人より「真の意味での発症の “危険性”」は高そうですよね。

しかし発症オッズも発症リスクも,計算上いずれも「イベントを発症した 1人」として同一に扱ってしまうのです。

追跡期間中のいつに発症しても同じ扱い

また,10 年間追跡するような前向き研究で,追跡開始1ヶ月後にイベントを起こしてしまう人と,最後の最後,10 年目にイベントを起こしてしまう人では,前者の方が「真の意味での ”発症の危険性”」は高そうな印象がありますよね?

しかしこれも,オッズ比やリスク比の計算上,全く勘案されない要素となります。最終的に発症していたら,いずれにしても1イベントのカウントになるのです。

こうした時間を勘案するような指標としては,率 rate や ハザード hazard が使われます。

時間を加味した指標

率 rate

  • 分子にイベント数,分母に「観測した人年」を持ってきて算出
  • 延べの観察期間(人年)内で,どれほど頻繁にイベントが起きるかを示す
ハザード hazard

  • 原則として「初回」のイベント発症までの時間を扱う指標
  • 「どのくらい『すぐに』イベントを起こすか」ということを表す

率 rate は,その「観察集団」が,どのくらいの「速度で」イベントを起こしていくのか,ということを知るのに有用です。

またハザードは,より早期に起こしやすいと見込まれる方が高い値として計算 されます。

このように,時間を勘案した上で「発症しやすさ」を群間比較したい場合には,オッズ比やリスク比ではなく,率比 (rate ratio) や ハザード比 (hazard ratio) を使うことになります。

これらについては,また別項で扱います。

まとめ

U got this

【本項のポイント】

  • オッズは〈比〉;あらゆる研究で定義が可能
  • リスクは〈割合〉;前向きに「追跡される集団」がなければ定義できない
  • リスク比は「X倍」と言ってもそのまま意味が通る
  • オッズ比は〈比の比〉であり,「X倍」と言っても直感的に解釈できない
  • 発症者の割合が十分低い時:オッズ比 ≒ リスク比
  • 発症者の割合が低くない時:オッズ比 >> リスク比
  • オッズ比の順位性 = リスク比の順位性
  • リスクもオッズも,時間的概念を含まない

参考文献

  1. JAMA Users’ Guide to the Medical Literature (3rd Edition)
    言わずとしれた名著。これさえ読んどけばなんとかなる。至高の一冊。
    原著の英語版がオススメです。Amazon
  2. 医学文献ユーザーズガイド(訳:相原守夫)
    上記の日本語版。実際に読む医学論文は全て英語なので,本書も上記の原著がオススメなのですが,ざっと見るときはやっぱり日本語がラクです。Amazon

[おすすめ本紹介]

ファクトフルネス FACTFULNESS


ビル・ゲイツが希望者全員に配布したことで有名な世界的超ベストセラー。スウェーデン医師・国際保健学教授である筆者が,誰もが勘違いしている「世界の事実」を1つ1つ挙げながら,本質を歪めて見てしまう人間の本能・バイアスを列挙していきます。脳髄に金槌で釘を打ち込まれるくらいの衝撃を何度も与えてくれる名著です。やや分厚い本ですが,Audible なら通勤時間で聞けてしまうので,大変オススメです。

─ ads ─
>医療統計の解説チャンネル

医療統計の解説チャンネル

スキマ時間で「まるきりゼロから」医療統計の基本事項を解説していく Youtube チャンネルを 2 人で共同運営しています。

CTR IMG