オッズとは何か?オッズ比とリスク比の違い|やわらか統計学

この記事では「オッズとは何か?」「オッズ比とリスク比の違いは何か?」についてまとめます。

いきなりまとめ:本項のポイント
  • オッズは〈比〉;あらゆる研究で定義される
  • リスクは〈割合〉;前向きに「追跡される集団」がなければ定義できない
  • リスク比は「X倍」と言ってもそのまま意味が通る
  • オッズ比は〈比の比〉であり,「X倍」と言っても直感的に解釈できない

まずはオッズの定義から見ていきましょう。

オッズとは何か

一般語としてのオッズ(Odds)を辞書で調べると「見込み」「勝算」などの訳がついています。しかし統計学における オッズとは,確率の〈比〉です。

オッズは「ある現象が起きる確率 p」と「起きない確率 1-p 」の〈比 ratio〉として定義されます(▼)。

$$ Odds = \frac{p}{1-p} $$

ただ数式を眺めていてもあまりピンときませんので,実際の例をみながら考えていきましょう。

オッズは比

いきなりですが,美女を二人 ── たとえば「北川 K 子さん」と「石原 S美さん」の二人を思い浮かべてください。このとき,学校の同級生 100人に「どちらがより好みか」を尋ねます。

仮に 60 人が K子さん を選び,40人が S みさんを選んだとしましょう。この場合,

ウチの学校では K 子の方が S みよりも 1.5 倍好まれている

という結論になると思います。

実はこれも立派なオッズです。言い換えれば これは,

K 子は S みと比べて人気のオッズが 1.5 である

ということです。

この学校においては「K子が選ばれる確率(p = 0.60)」と「Sみが選ばれる確率(= K子が選ばれない確率)(1-p = 0.40)」のが,1.5 であるということです。

オッズは2つのものの「比較」に適する

このとき

本校では K 子を好む人が 60%,S みを好む人が 40% である

と〈割合〉を示しても良いのですが,直接「1.5 倍人気」と言ってしまった方が,どちらがより高い人気であるのかを伝えやすい印象があると思います。

それは当初の目的が「両者の比較」というところにフォーカスされていたからです。こういう場合には〈割合〉を提示するよりも,〈比〉(=オッズ)を提示することが適しています。

─ ads ─

ギャンブルでのオッズ

Gamble

別の例も見てみます。〈オッズ〉という言葉を日常生活でも目にすることがあるのは,やはり賭け事の世界です。

ギャンブルではオッズが非常に大切な指標になります。その賭け事で勝利したとき,どれほどの払い戻しがあるか(という比、、、、)を端的に示してくれる指標だからです。

例えば,5 回に 1 回の勝率(つまり p=0.2)というものは,勝利のオッズで示すと

$$\frac{p}{1-p} = \frac{0.2}{1 − 0.2} = 0.25 $$

となります。

賭け事では一般に勝利オッズが低いものほど,その事象が起きた場合の儲けが大きくなるように掛け金が分配されます(ハイリスク・ハイリターン)。つまり一般的には「勝利オッズの逆数(=敗北オッズ)」に比例した払い戻しになるよう設定されます。

たとえば勝利オッズ 0.25(=敗北オッズ 4.0)のものに 1万円 を賭けておくと,もし「当たり」を引き当てた場合には 1万円 ÷ 0.25 = 4万円 を受け取れる,といった具合です。

※)現実には胴元が手数料などを差し引くため,ピッタリ逆数で分配されることはありません。また,賭け事で〈オッズ〉と言う時には「掛け金」と「勝利時の払戻金」の〈比〉を表すのが一般的です。
|余談:Odd と Even
オッズの語源は “Odd” ですが,これは数学用語では奇数を意味します。いっぽう偶数は “Even” です。また Even には「五分五分である」という意味もあります。面白いのは,五分五分 even の状況では Odds = 1 になる(50:50)ということです。裏返せば,五分五分 even でない状況でこそオッズに意味がある(Odds ≠ 1)とも言えます。なお Odd という英単語は「奇妙な」 という形容詞でもありますが,ある意味これも「even ではない」というイメージに合致するような気がします。

オッズとリスク

導入が長くなってしまいましたが,ここまでで強調したかったことは「オッズ=〈比〉である」ということです。そしてここからが本題です。

医療統計において〈オッズ〉は,「あるイベントが起きる確率」と「起きない確率」の〈比〉を示すものとして扱われます(▼)。

オッズ(Odds)とは?
  • 発症オッズ = 発症確率と発症しない確率の〈比〉
  • 〈比〉なので,0 ~ ∞ の値を取る
$$ \text{発症オッズ} =\frac{\text{発症する確率} \ p}{\text{発症しない確率} \left( 1-p\right) } $$

類似概念として〈リスク〉がありますが,これらの混同には注意が必要です。いずれも「その現象の起こりやすさを示す指標」という点では類似していますが,両者は「分母がちがう」ため全く異なる数値を取ります(後述)。

リスク (Risk) とは?
  • 発症リスク = 追跡・観察した対象群の中で,発症者が占めた〈割合〉
  • 〈割合〉なので 0~1 (0%〜100%)の値しか取らない
$$ \text{発症リスク} =\frac{\text{観測集団内で発症した人数} }{\text{全観測対象者数} } =\text{観測集団内での発症確率} \ p $$

オッズとリスクの違い

ここではまず端的に

オッズは〈比 ratio〉で,リスクは〈割合 proportion〉

と考えていただければOKです(▼)。

■オッズとリスクの違いの模式図:Risk and odds

オッズ比 と リスク比

なお「ある集団における発症リスク(や発症オッズ)」は疫学的に重要な指標ではありますが,それはあくまで〈特定の標本集団〉におけるデータについて記述したものに過ぎません。

一方,なんらかの介入や要因曝露によって「どの程度の益や害があるのか」という〈効果の推定〉には,オッズやリスクの変化量の比較、、、、、、の方が重要となります。

つまり

ある「危険因子」はどれほどの「害」なのか?

ある「治療介入」はどれほどの「益」なのか?

といったことを定量化するために,発症オッズや発症リスクそのものを見るのではなく,発症オッズの変化の度合い,発症リスクの変化の度合いに着目する必要があります。

この「ある特定の介入あるいは要因曝露の有無によって,どれほど発症オッズや発症リスクが変化するか」という情報が,オッズ,リスクという概念です(▼)。

  • 「対照群における発症オッズ」と「曝露群における発症オッズ」の比
    オッズ比 OR; Odds Ratio
  • 「対照群における発症リスク」と「曝露群における発症リスク」の比
    リスク比 RR; Risk Ratio
リスク比 risk ratio は,相対リスク relative risk とも表現されます。また,オッズ比 odds ratio は相対オッズ relative odds と呼ぶこともあります。

オッズとリスクの使い分け

では同じような指標である〈オッズ〉と〈リスク〉は,どちらを使った方がよいのでしょうか。

それは私たちが「どのような点に関心を持っているか」ということによって異なりますが,端的には以下のように言えると思います。

  • 「ある1つの事象そのもの」に関心がある場合はリスクがよい
  • 「2つ以上の事象(の比)」に関心がある場合はオッズがよい

具体例を見てみましょう。

「死亡リスク」か「死亡オッズ」か

例えば「エボラ出血熱を罹患すると,そのうちの半数(の割合)が死亡する」という場合について考えてみます。このとき

  • 死亡リスク = 0.5(50%)
  • 死亡オッズ =(50:50)

となります。

ここでどちらの表現がより分かりやすいかといえば,明らかに前者でしょう。これは「死亡というイベントそのもの」への関心があり,死亡と生存の〈比〉にはあまり関心がないからです。

逆に「賛否」や「好き嫌い」「男女比」「人気投票」のように,両者の対比に関心があるときは,オッズ(比)のほうがわかりやすいというわけです。

*)冒頭の美女人気投票,ギャンブル(掛け金と払戻金の比)はその典型例

リスクの方が理解しやすい

しかし実を言うと,医学論文などで〈比〉(=オッズ)それ自体、、、、を特別に知りたいシチュエーションはほぼありません。

たとえば死亡なら先述のように死亡リスクの方が知りたいわけで,特に「死亡オッズ(=死亡確率と生存確率の比)」そのもの、、、、に関心を抱くことはよほどありません。

また死亡に限らず,疾患や副作用といった「イベントが起きる確率」は全般にそうです。発症確率と発症しない確率の〈比〉(=オッズ)それ自体、、、、に興味を抱くことはあまりないのではないでしょうか。

そもそも医学のシチュエーションでは

リスクの方が,オッズよりも直感的に解釈しやすい

ということは明白です。

それでも尚オッズを使う理由

しかしそれでも尚,実際の科学論文ではむしろリスクよりもオッズの方を見かけることが多いものです。

直感的解釈が難しい〈オッズ〉がこうも頻用される理由はいったい何なのでしょうか。個々の点ついては後ほど取り上げますが,その回答の際たるものは,

リスクは算出できない場面があるが,オッズはいつでも算出できる

というものかもしれません。

リスクは原則「前向き研究」でしか算出できませんが,オッズはどのような研究方式であっても算出することができるため,汎用性が高いのです。

オッズはいつでも算出可能

Xrok

先述したように,リスクとは「ある人数の集団の中で何人がイベントを起こすか」という〈割合 proportion〉です。ですから大前提として〈観測・追跡される集団〉がなければリスクは算出できません(▼)。

$$\text{発症リスク(割合)} =\frac{\text{イベントを起こした人数} }{\text{観測・追跡された集団の全人数} } $$

つまり「発症リスク」といった概念は原則として〈コホート研究〉や〈ランダム化比較試験〉といった,前向き縦断研究で算出するものだということです。〈症例対照研究〉のような後ろ向き研究や,ある時点での調査を行う〈横断研究〉では,リスクの算出は困難です。

しかし〈オッズ〉であれば,前向き研究でも後ろ向き研究でも計算することが可能です。

以下では実際に,前向き研究と後ろ向き研究におけるリスク・オッズの算出過程をみてみましょう。

前向き研究でのオッズとリスク

次の様な研究を行なった場面を考えてみます(▼)。

前向き観察研究
  • 同年代で喫煙習慣のある人と,喫煙習慣のない人を,それぞれ50人ずつ集めて,25年間追跡するという前向き調査を行った
小規模な〈前向きコホート研究〉に分類されます

この合計 100 人のうち,何名かは発癌することが見込まれるわけですが,喫煙者の方が喫煙していない人と比べて どのくらい、、、、、 発癌しやすいのか,という点を調査します。

このとき,喫煙していた 50 人のうち 16 人が発癌してしまい,喫煙していなかった 50 人からは 4 人しか発癌しませんでした。つまり以下のようなデータ(▼)が得られたとします。

【結果】喫煙者と非喫煙者 50人ずつを追跡した
発癌した (outcome+) 発癌しなかった (outcome-) 合計
喫煙あり 16 34 50
喫煙なし 4 46 50
合計 20 80 100

発癌リスクの比は?

このとき,喫煙による発癌リスクの増加はどの程度でしょうか?

ここでは 50 人ずつ計 100 人という〈観測・追跡された集団〉がありますので,発癌リスク(発癌した人の割合)を直接算出することができます。

喫煙あり群の発癌リスク: 16/50 = 0.32(32%)
喫煙なし群の発癌リスク: 4/50 = 0.08 (8%)

リスク比 risk ratio: 0.32 ÷ 0.08 = 4

つまり,直感的にわかるように,喫煙によって発癌のリスクは 4 倍になる,ということが言えます。

発癌オッズの比は?

では,このとき「発癌オッズ」はどうなっているでしょうか。

発癌オッズ = 発癌する確率/発癌しない確率

という〈比〉ですから,以下のように計算できます。

【結果】喫煙者と非喫煙者 50人ずつを追跡した
発癌した (outcome+) 発癌しなかった (outcome-) 合計
喫煙あり 16 34 50
喫煙なし 4 46 50
合計 20 80 100
喫煙あり群の発癌オッズ:16/50 ÷ 34/50 = 16/34 = 0.47
喫煙なし群の発癌オッズ:4/50 ÷ 46/50 = 4/46 = 0.087

オッズ比 odds ratio: 16/34 ÷ 4/46 = (16×46)/(34×4) = 5.4

つまり,喫煙によって発癌のオッズは 5.4 倍になる,ということです。

この時,オッズは「発癌する確率/発癌しない確率」という〈比〉であり,オッズ比は「さらにそれらの比」であることに留意してください。

オッズ比とリスク比

まとめると今回のデータからは「喫煙で発癌リスクは 4 倍になり,発癌オッズは 5.4 倍になる」ということが言えそうです。

なお,このように

オッズ比の方がリスク比よりも数字が派手になる

ことが知られています(詳細後述)。

そのため〈オッズ〉と〈リスク〉を混同してしまうと,効果を過剰に解釈してしまう可能性があります。たとえば今回の例において,オッズ比 5.4 という結果を見て「リスクが 5.4 倍になります!」と言ってはいけません。リスク比はあくまで4倍です。

オッズ比は〈比の比〉

ここで理解しておきたいことは,そもそも

オッズ比を直感的に解釈することは難しい

という問題です。

私たちが直感的に「●●倍です!」と言われて,そのまま解釈できるのもは〈リスク比〉の方だけなのです。

なぜならオッズはそもそもが〈確率の比〉だからです。オッズが〈比〉なのですから,オッズはそのまた比,つまり〈比の比〉になっています。

そのようなオッズ比(=比の比)がいくつだからと言って,その数字の意味するところを直感的に理解することは不可能です。

【下記の例で間違ってもリスク 21倍!と言ってはいけない】
OR and RR
▲ 危険因子への曝露によって,発癌リスクが 9 倍,発癌オッズは 21 倍になっている
マスメディアもしばしばオッズとリスクを混同した報道を行っています。誇張のため確信的におこなっている場合もあるかもしれません。情報の受け取り手が気をつけなければならないポイントの1つです。

後ろ向き研究はオッズのみ

続いて,後ろ向き研究を考えてみましょう。以下のような研究をイメージしてみてください(▼)。

後ろ向き研究
  • ある病院である月に「がん」と診断された人 20人 と,同施設の同月に「がん」ではない病気の診断を受けた 80人 を対象に,これまでの喫煙歴を調査
〈症例対照研究 case-control study〉に分類されます

この研究では,がん患者さん(case)は 20人中16人も喫煙歴があったことが判明し,がんではない疾患だった人(control)の80人のうち,喫煙歴があったのは34人でした。

つまり以下のようなデータが得られたとします(▼)。

【結果】がん患者と非がん患者の過去の喫煙歴を調査
がん患者 (case) がんでない患者 (control)
喫煙歴あり 16 34
喫煙歴なし 4 46
合計 20 80

発症リスクは算出不能

実はこのデータの中身の数字は,先ほどの前向き研究のものと全く同じ内容になっています。

しかし決定的な違いとして,ここでの100人(20人 + 80人)は〈追跡・観測された集団〉ではない,ということが重要です。

まずがんと診断された case が 20 人いて,それと同時期に別の病気の診断を受けた同年代の 80 人ほどのデータを研究者が集めてきただけです。「後から」適当にみつくろってきただけです。

ですから発症リスク(=発症者の割合)はここでは算出できません。発症者の割合を算出しようにも,分母にあたる〈追跡された集団の全体数〉が存在しないからです(▼)。

$$\text{発症リスク(割合)} =\frac{\text{イベントを起こした人数} }{\text{観測・追跡された集団の全人数} } $$

この研究では 20人の case と 80人の control を集めていますが,その合算(全体数)である “100” に特別な意味はありません。この集団の中での発症リスクは 20/100 です!と言われても話が通らないのです。

つまりこのケースでは,喫煙者における発癌リスク(割合)も,非喫煙者における発癌リスク(割合)も不明だということです。

先ほどの例は前向き研究でしたので,「行」方向のデータに「実質的意味」がありましたが,今回のデータは「列」方向にしか実質的意味がない,ということです。

発症オッズも算出不能

以上から,この研究では以下の項目がすべて算出できません(▼)。

【後ろ向き研究では,以下は全て求められない】
  • 喫煙者における発癌リスク = ?
  • 非喫煙者における発癌リスク = ?

  • 喫煙者における発癌オッズ = 発癌する確率(?) / 発癌しない確率(?)
  • 非喫煙者における発癌オッズ = 発癌する確率(?) / 発癌しない確率(?)

ここで,〈発癌リスク〉と同様,〈発癌オッズ〉も算出できないことに注意してください。

えっ,じゃあオッズ比も計算できない?

と思ってしまいますが,そうではありません。この場合でも〈オッズ比〉を計算することは可能です。

とは言え先述したように「喫煙者における発癌オッズ」と「非喫煙者における発癌オッズ」はわかりませんから,その〈比〉は求められません。

ではどうやって計算するのか?

ここで計算するのは,「発症者が喫煙(という因子)に曝露していたオッズ」と「非発症者が喫煙(という因子)に曝露していたオッズの〈比〉です。これなら手元のデータからそのまま求めることができます。

要因に曝露していたオッズを比較する

実際に計算してみましょう。

【結果】がん患者と非がん患者の過去の喫煙歴を調査
がん患者 (case) がんでない患者 (control)
喫煙歴あり 16 34
喫煙歴なし 4 46
合計 20 80
癌患者が喫煙に「曝露した確率」の比(オッズ) = 16/20 ÷ 4/20 = 16/4 = 4.0
非癌患者が喫煙に「曝露した確率」の比(オッズ) = 34/80 ÷ 46/80 = 34/46 = 0.74

上記のオッズ比 = 16/4 ÷ 34/46 = (16×46)/(34×4) = 5.4

ここで出てきた「オッズ比 5.4」は,先程の前向き研究の例と同値になっています。これこそが「オッズ比」の強みの1つです。

行方向に計算しても列方向に計算しても同じ

つまりオッズ比の計算においては

  • 前向き研究のデータで「行方向に」直接「発症オッズ」を算出してその〈オッズ比〉を算出した場合
  • 後ろ向き研究のデータで「列方向に」「曝露オッズ」を算出してその〈オッズ比〉を出した場合

で,最終的な計算式が全く同じになる のです。

これは,オッズ比が〈比の比〉だからこそ為せる技です。列方向からでも行方向からでも,オッズ比は全く同じ「たすきがけ」の数式で算出されます(▼)。

行からでも列からでもオッズ比は算出可
発症あり 発症なし
曝露あり A B
曝露なし C D
  • 曝露あり群の〈発症オッズ〉 A/B(前向き研究でのみ算出可)
  • 曝露なし群の〈発症オッズ〉C/D(前向き研究でのみ算出可)
  • 発症あり群の〈曝露オッズ〉A/C(後ろ向き・横断研究でも算出可)
  • 発症なし群の〈曝露オッズ〉B/D(後ろ向き ・横断研究でも算出可)

  • 〈発症オッズ〉の〈比〉=(A/B ÷ C/D)= AD/BC
  • 〈曝露オッズ〉の〈比〉=(A/C ÷ B/D)= AD/BC

★ 発症オッズの比 = 曝露オッズの比(数式上)

いわゆる「たすき掛け計算」になっている

曝露オッズの比 = 発症オッズの比

前向きに追跡する集団を持たない研究では〈発症リスク〉も〈発症オッズ〉も算出することはできません。

しかし〈曝露オッズ〉やその〈比〉は算出することが可能です。そしてそれは,前向き研究データで得られる〈発症オッズ〉の〈比〉と数学的に同一のものとなるのです。

曝露オッズの比 = 発症オッズの比 (数式上)

この様にオッズ比は研究方式を選ばず同一指標として扱うことができるため,研究者に好まれます。データとしての汎用性が高い,ということです。

|とはいえデータの素性は重要
なおここで「数式上」と但し書きをしたのは,やはり「前向きデータで得られたオッズ比」と「後ろ向きデータで得られたオッズ比」を完全に同一視することは難しいからです。そもそも前者は〈発症オッズ〉の〈比〉になっていますが,後者は〈曝露オッズ〉の〈比〉であることは先述した通りです。数学的には同一となるものでも,「実際に前向き」のデータから得られたオッズ比と後ろ向きのデータから得られたオッズ比は,やはり素性が異なるものです(バイアスリスクという観点でも)。しかし研究方式を選ばず同じパラメタとして運用できるという点で,オッズ比の方がリスク比より汎用性が高い指標であることは間違いありません。

その他のオッズの特徴

オッズが広く用いられる理由としては,他にも以下のような理由が挙げられます。

  1. まれな現象の場合,オッズはリスクに近似できる
  2. 数学的に扱いやすい
  3. ロジスティック回帰分析で用いる

順に見ていきましょう。

特長①:発症がまれな場合,オッズはリスクに近似する

Calc

オッズに関する重要なポイントとして,

リスクが十分小さい時,オッズとリスクはほぼ同じ値になる

ということが挙げられます。これは数式から容易に推定できますので,実際に計算してみましょう。

最初にお示ししたように,

発症オッズ = 発症確率/発症しない確率

ですが,ここで「ある集団における発症確率」は「その集団内における発症リスク p」とも言い換えられます。

つまり

$$ 発症オッズ = \frac{発症リスク}{1-発症リスク} = \frac{p}{1-p} $$
$$ 発症リスク = \frac{発症オッズ}{1+発症オッズ} $$

と示すことができます。

ここで,例えば発症リスクが 1% 程度,つまり p = 0.01 の場合を想定してみましょう。
そうすると,上記式より,

$$ 発症 Odds = \frac {0.01}{1-0.01} = \frac {0.01}{0.99} ≒ 0.01 $$

となります。

発症オッズは,発症リスク(0.01)とほとんど同じ値になっています。

|数式の補足
発症あり 発症なし
曝露あり A B
曝露なし C D
  • 曝露あり群における発症オッズ = A/B
  • 曝露なし群における発症オッズ = C/D
  • 曝露あり群における発症リスク = A/(A+B)
  • 曝露なし群における発症リスク = C/(C+D)

  • まれな疾患では,発症あり <<< 発症なし
  • つまり A+B ≒ B,C+D ≒ D
  • この時,曝露あり群の発症リスク A/(A+B) ≒ A/B (= 発症オッズ)
  • この時,曝露なし群の発症リスク C/(C+D) ≒ C/D (= 発症オッズ)

オッズ “比” もリスク “比” に近似する

稀なイベントを対象にする場合は,同様にオッズも,リスクに近似できます。

|数式の補足
発症あり 発症なし
曝露あり A B
曝露なし C D
  • 曝露あり群における発症リスク = A/(A+B)
  • 曝露なし群における発症リスク = C/(C+D)

  • \( 発症リスク比 = \frac{A(C+D)}{C(A+B)} \)
  • \( 発症オッズ比 = \frac{AD}{BC} \)

  • まれな疾患では,発症あり <<< 発症なし
  • つまり A+B ≒ B,C+D ≒ D
  • これを発症リスク比の式に代入すると,発症リスク比≒ 発症オッズ比

オッズ比も直感的解釈が可能に

オッズ比がリスク比に近似できるのであれば,オッズ比の「直感的に解釈することができない」という欠点が克服されるため,非常に大きい益があります。

もともと「発症が稀なイベント」は症例が集まりにくく,ランダム化比較試験やコホート研究のような前向き試験で頑健なエビデンスを示すことは困難です。しかしそのように稀なものであれば〈オッズ比〉が〈リスク比〉と近似できるため,〈症例対照研究〉によるオッズ比計算が大きな威力を発揮します。

ただし,稀ではない現象を対象とする場合,オッズ比とリスク比は大きくズレてしまうので注意が必要です(下図参照▼)。

オッズ比とリスク比の換算グラフ
図から,発症割合(=リスク)が 0.01(=1%)程度であれば,オッズ比とリスク比のズレは小さい(オッズ比15のときリスク比14)ことがわかります。しかし発症割合が0.25(=25 %)にもなると,そうはいきません。オッズ比が大きくなるほどリスク比からのズレも大きくなっていき,オッズ比 15 の時,リスク比はたったの 4 (!) です。このように,発症割合が増えるほど,またオッズ比の値が大きくなるほど,リスク比とオッズ比の数字的な乖離は大きくなっていきます。そこで「オッズ比 XX」を「リスクが XX 倍!」と混同すると,大変な誇張になります。

オッズ比とリスク比の順位性

なお上図から明らかなように,どのようなパターンであってもオッズ比とリスク比は「正の相関関係」をもちます。

リスク比が大きい時,オッズ比も大きくなり
リスク比が小さい時,オッズ比も小さくなる

単調増加の相関性であるため,順位も変わりません。これも有用な点の1つです。

たとえば,種々の危険因子への曝露と発癌リスクの関連性を検討するコホート研究があったとします。

結果として ①喫煙,②飲酒,③運動習慣欠如 による発癌オッズ比(OR)が,順に 5,3,2 となったとします。このオッズ比の「値それ自体」を直接解釈することが不可能であることは,先述した通りです。

しかし,オッズ比の順位はリスク比の順位と変わりません。たとえばこの時「発癌リスク比(RR)」を正しく計算すると,順に 2倍,1.5 倍,1.2 倍となっているかもしれませんが,この順序はオッズ比の順序と合致します。

つまり,この例で言えば,①②③のうち最も大きな影響があるのは「①喫煙」である,ということまでは,リスクを算出できない様な研究からでも十分検討することができます。

リスク比とオッズ比の関係性まとめ
  • 発症者の割合が低い時:発症オッズ比 ≒ 発症リスク比
  • 発症者の割合が高い時:発症オッズ比 >> 発症リスク比
  • 発症者の割合に関わらず:オッズ比の順位性 = リスク比の順位性

特長②:数学的な扱いやすさ

また数学的な処理がしやすいことも,研究でオッズが好まれる理由の1つです。

と言われてもあまりに抽象的でピンとこないかもしれませんが,やはり「分母に分子が含まれない」というのが強みです。その1つとして,オッズは分子 と分母 を反対にしても解釈が可能です。

たとえば 100人のがん患者を追跡したところ,5年以内に死亡した人の割合は 75% ,生存した人の割合 25% の 3倍 であったとします。この時,そのがんによる 死亡オッズ = 3 ですが,別の観点で言えば,そのがんによる生存オッズ = 1/3 とも言えます。

オッズはただの比ですから,逆数でもそのまま意味を持つのです。

また数式からも,リスク比と比べて明らかに数学的処理が簡単そうであることは一目瞭然でしょう(▼)。

発症あり 発症なし
曝露あり A B
曝露なし C D
  • \(\text{発症リスク比} =\frac{A/(A+B)}{C/(C+D)}\)
  • \( \text{発症オッズ比} = \frac{A/B}{C/D} \)

特長③ ロジスティック回帰分析で用いる

最後は実務的な内容ですが,オッズ比は ロジスティック回帰分析 logistic regression で利用されるものであるため,広く使われているという点もあります。

ここでの細かい説明は割愛しますが,ロジスティック回帰分析は,あるイベントが起きる確率 p が下記の数式(▼)に従って求められる(下記の数式に値を代入すれば p の予測値が得られる)という,モデル化方法のことです。

$$ p = \frac{1}{1+ \exp (-(a_1x_1+a_2x_2+ \cdots + a_nx_n + b) ) } $$
この様に,一定の数式モデルに当てはめて目的の数値を算出することを,一般に回帰分析と呼びます。ロジスティック回帰はその一種です。

この数式を変形すると,

$$ \frac{p}{1-p} = \exp(a_1x_1 + a_2x_2 + \cdots + a_nx_n + b) $$
あるいは \( \log \frac{p}{1-p} =a_{1}x_{1}+a_{2}x_{2}+\ldots +a_{n}x_{n}+b \)

となります。この式の左辺は,オッズそのものですよね。

ロジスティック回帰分析は医療統計で非常に多用される統計解析方法の一種で,前向き研究でも後ろ向き研究でも用いられます。

オッズが統計を用いた論文で頻用される理由の1つは,このロジスティック回帰分析との兼ね合いというもあるのです。

この辺りは非常に混み入った話になるので,また別項で扱いたい内容です。

オッズとリスク共通の弱点

Clocks

オッズとリスクの説明は以上で概ね終了です。

しかし最後に,この2つの指標が持つ大きな欠点について言及させて頂きたいと思います。 それは

オッズもリスクも「時間的要素」を無視した概念である

ということです。

時間的要素を含めない

具体的には以下の点が問題になります(▼)。

  • 複数回おこすイベントに対応できない
  • 発症タイミングの早さを勘案できない

複数回おこすイベントには対応できない

例えば,年に2回 イベントを起こす人は,年に1回イベントを起こす人より「真の意味での発症の “危険性”」は高そうですよね。

しかし発症オッズも発症リスクも,計算上いずれも「イベントを発症した 1人」として同一に扱ってしまうのです。

追跡期間中のいつに発症しても同じ扱い

また,10 年間追跡するような前向き研究で,追跡開始1ヶ月後にイベントを起こしてしまう人と,最後の最後,10 年目にイベントを起こしてしまう人では,前者の方が「真の意味での ”発症の危険性”」は高そうな印象があると思います。

しかしこれも,オッズ比やリスク比の計算上,全く勘案されない要素となります。最終的に発症していたら,いずれにしても1イベントのカウントになるのです。

このように時間を勘案するような指標としては,率 rate や ハザード hazard が使われます。

時間を加味した指標

率 rate
  • 延べ観察期間(人年)内で,どれほど頻繁にイベントが起きるかを示す
  • 分子にイベント数,分母に「観測した人年」を持ってきて算出
ハザード hazard
  • 原則として「初回」のイベント発症までの時間を扱う指標
  • どのくらい「すぐに」イベントを起こすかということを加味する

つまり「時間の概念」を勘案した上で「発症しやすさ」を群間比較したい場合には,オッズ比やリスク比ではなく,率比 (rate ratio) や ハザード比 (hazard ratio) が効果指標になる,ということです。

これらについてはまた別項で扱います。

まとめ

U got this

本頁の総まとめ
  • オッズは〈比〉;あらゆる研究で定義が可能
  • リスクは〈割合〉;前向きに「追跡される集団」がなければ定義できない
  • リスク比は「X倍」と言ってもそのまま意味が通る
  • オッズ比は〈比の比〉であり,「X倍」と言っても直感的に解釈できない
  • オッズ比とリスク比の関係性は以下がポイント
    • 発症者の割合が十分低い時:オッズ比 ≒ リスク比
    • 発症者の割合が低くない時:オッズ比 >> リスク比
    • オッズ比の順位性 = リスク比の順位性
  • オッズもリスクも,時間的概念を含まない
他にも,リスク比は「どのようなリスク集団において規定されたものか」というベースラインリスクに大きな影響を受けるため複数研究同士で直接比較や解釈ができない(portabilityが低い)という問題もあります。オッズ比は単に「比の比」であるため,ベースラインリスクによらず単純な「効果の大きさ」の指標として捉えることができます。
PMID: 34380019 DOI

参考文献

  1. JAMA Users’ Guide to the Medical Literature (3rd Edition)
    言わずとしれた名著。これさえ読んどけばなんとかなる。至高の一冊。
    原著の英語版がオススメです。Amazon
  2. 医学文献ユーザーズガイド(訳:相原守夫)
    上記の日本語版。実際に読む医学論文は全て英語なので,本書も上記の原著がオススメなのですが,ざっと見るときはやっぱり日本語がラクです。Amazon

[おすすめ本紹介]

Users’ Guides to the Medical Literature


タイトル通り「医学論文を現場でどう応用するか?」迷える臨床家のためのユーザーズガイド。Tips 集のような構成で,どこからでもつまみ読みできます(通読向きではない)。医学論文の批判的吟味を学ぶにあたり 1 冊だけ選ぶならコレ,という極めて網羅性の高い一冊です。著者 Gordon Guyatt 氏は “EBM” という言葉を作った張本人。分厚い本ですが,気軽に持ち歩ける Kindle 版はオススメです。邦訳版もあります。

医学文献ユーザーズガイド 第3版


表紙が全然違いますが「Users’ Guides to the Medical Literature (JAMA)」の邦訳版。医学文献を批判的吟味するためのTips集としてかなりの網羅性を誇る代表的な一冊です。唯一の欠点は Kindle版がないこと(英語版はある)と,和訳が気になる部分が結構あること。2つでした。原著とセットで手に入れると最強の気分を味わえます。鈍器としても使えます

─ ads ─
>医療統計の解説チャンネル

医療統計の解説チャンネル

スキマ時間で「まるきりゼロから」医療統計の基本事項を解説していく Youtube チャンネルを 2 人で共同運営しています。

CTR IMG