【解説】率と割合と比の違い|統計超入門

今回の記事では,特に誤用や誤解の多い【割合】と【比】と【率】の違いについて簡潔にまとめます。

本頁で扱う内容のまとめ

  • 〈割合 proportion〉 ── 時間的概念を含まない|単位 %
  • 〈率 rate〉 ── 時間的概念を含み,起きる速度を示す|単位 /person-year
  • 〈比 ratio〉 ── 単に 2 つのものの大きさを比較した数値|単位なし
  • 〈罹患率 morbidity〉 ── 本質は〈率〉|定義通り
  • 〈有病率 prevalence〉 ── 本質は〈割合〉| 名前は “率” なのに!

割合 proportion

【割合 proportion】は,集団全体の中で疾患ないし状態(A)を有する人が占めるところを示したものです。

【割合】:ある時点で,全体のうち [A] になっている人の占める部分(%)

ポイントは,「時間的概念を含まない」というところです。

時間を含まない概念ですので,一時点のみで測定を行う様な横断的研究・横断的調査でも算出が可能です。

定点観察でも求められる指標,ということになります。

率 rate

いっぽうで【率 rate】は,速度を含む概念です。

【率】:単位人年あたりの発症者数 (/人年) ※(per person-year)

例えば医学系の RCT でよく用いられるアウトカム(エンドポイント)として,有害事象の〈発生 incidence rate〉だとか,特定の疾患の〈罹患 morbidity〉あるいは〈死亡 mortality rate〉等が挙げられます。

これらは全て,「何人×何年追跡したところ,どのくらいのイベントが発生したか」というものです。

算出方法はシンプルです。

$$\text{率 (rate)} =\frac{\text{イベントを起こした人数} }{\text{追跡期間×人数の総和(人年)} } $$

という計算式で算出されます。

分母となる「追跡期間」×「人数」の総和という点に関して,「追跡期間」はそれぞれバラバラでも構いません。

20人を追跡したとして,A さんは 5 年,B さんは 6 年,C さんは 4 年……

とバラバラになっていても,その総和を求めれば「観察した(総)人年」が求められます。

その「観察した(総)人年」の中で,イベントを観測された人が何人いたかわかれば,後はそれを割って,「単位人年あたりのイベント発症者数」を求めるだけです。

ですから,

単位: イベント発症者数/人年 per person-year

となるわけです。

この様に時間を含む概念であるため,研究方式としては〈前向きの縦断研究〉でなければ測定できません。

つまり,ランダム化比較試験などの介入研究か,観察研究であれば基本的にコホート研究でなければ算出できないものになります。

割合と率の具体例

率 rate と 割合 proportion について具体例を挙げて考えてみます。

─ ads ─

ある特定時点での調査

たとえば,ある特定のタイミングで調査をしてみたら,施設利用者 100 人の集団の中に 5 人のインフルエンザ患者がいた,という場合を考えてみましょう。

この時,その施設における発症者割合は,

5 ÷ 100 = 0.05

つまり 5 % ということになります。

この様な “ある時点” での数を調べる調査を〈横断研究〉と呼びます。

ある集団を 1 年追跡した調査

一方,ある施設の利用者 100人を 1年間追跡したところ,その1年の間に 5 名がインフルエンザになってしまった,という場合はどうでしょうか。

途中打ち切りは無かったものと仮定します。

このときは,発症

$$ \frac{5}{100\text{(人)} \times 1\text{(年)} } =0.05\text{(/人年)} $$

ということになりますし,

追跡期間の中での発症者の割合

$$\frac{5\text{(人)} }{100\text{(人)} } =0.05\text{} =5\% $$

となります。

いずれも 0.05 となり,数字上は違いがありません。

尚,この様に特定集団を追跡する調査を〈前向き縦断研究〉と呼びます。

ある集団を 2 年追跡した調査

では,ここで追跡期間が 1 年ではなく 2 年であった場合はどうでしょうか。

発症者は同様に 100人中の5名であったとします。

この時,発症

$$\frac{5}{100\text{(人)} \times 2\text{(年)} } =0.025\text{(/人年)} $$

ということになります。

一方その期間の中での発症者の割合は,

$$\frac{5\text{(人)} }{100\text{(人)} } =0.05=5\% $$

です。

まとめると,以下のようになります(▼)。

$$ \text{発症率} =\frac{\text{発症者数:5} }{\text{観測人年:100人×2年} } =0.025 $$


$$ \text{発症割合} =\frac{\text{発症者数:5} }{\text{観測集団の人数:100} } =0.05 $$

先ほどの1年だけ追跡した例とは異なり,〈割合〉と〈率〉で明かに数字に変化が見られます。

この様に,ある一定期間の中で「死亡」というイベントがどの程度起きるのか?という 速度的概念を含むのが,死亡〈率〉の特徴です。

誤用が非常に多い

なお,この【割合 proportion】と【率 rate】というのは非常に誤用が多いことで有名です。

特に日本では,「有病率」という言葉があるために,さらに混乱を招いているフシがある様に思います。

この点についても見ていきましょう。

有病〈率〉なのに本当は〈割合〉?

〈有病率〉という言葉は主に〈Prevalence〉という英語に対してつけられる日本語訳ですが,ここで問題となるのが,〈率〉の意味合いです。

〈有病率〉の定義を辞書で確認してみますと,

【有病】:ある一時点において,実際に疾病を有している人の〈割合〉

となっています。

つまり名前には〈率〉とあるのに,実質的には速度の概念を含まない概念 ──〈割合〉── なのです。完全に矛盾してしまっています。

$$\text{有病率} =\frac{\text{その集団内で,ある一時点において疾病を有する者の数(人)} }{\text{観察集団の全人口(人)} }$$

この言葉のせいで,もともと誤用の多い〈割合〉と〈率〉について,さらなる混乱を招いている様に感じます。

有病率が使われる場面

〈有病率〉(=有病者割合)は,『ある特定時点での,観測集団内の健康問題の大きさ』をはかる横断的な指標です。

「いま」「まさに」この人口の中にどのくらいの患者さんがいるか(という”割合”)を知ることで,行政が施策を練る際に有用です。

とにかく,あくまでも〈割合〉であるということです。

この〈有病率〉とよく混同される紛らわしい概念に〈罹患率〉があります。

罹患〈率〉は,ちゃんと〈率〉

【罹患率 morbidity】は一定期間にどれだけの疾病(健康障害)者が発生したかという〈速度〉を加味した概念です。

罹患率:一定期間にどれだけの疾病(健康障害)が発生したか(/10万人年)

こちらは有病率と異なり,ただしく定義通りの〈率〉であるというわけです。

$$\text{罹患率} =\frac{\text{観察期間のあいだに新規発生した患者数(人)} }{\text{観察された「人年」の総和(人年)} }$$

罹患率が使われる場面

罹患率は,疫学的観点で非常に重要な指標です。

例えば,ある地方自治体で,ある特定の疾患の罹患率を計測し続けたとき,ある時点から突然その罹患率が上昇した,ということがわかったとします。

言い換えればこれは,その特定の疾患が発生する速度が速くなった,ということです。そうすると,何かその裏に発生要因があるのでは?という推論が可能となり,実際に現地調査を行うきっかけとなります。

罹患率が上がるときには,なにかその裏に隠された原因(発生要因)がある場合が多いからです。

水道会社 A を使っている世帯でコレラの罹患(死亡)がめちゃくちゃ高く,水道会社 B を使っている世帯ではそうでもない,と気づいたジョン・スノウ医師(1813-1856)は疫学の父と呼ばれています。

したがって〈罹患率〉は,疾病と発生要因との因果関係を探る場合に有用な指標であると言えます。

2020 年現在,世界で猛威を振るう SARS-CoV-2 の調査なども〈罹患率〉を正しく把握するために世界各国の各自治体・保健所が大変な努力をしているものと思われます。

有病率と罹患率の違い

Prevalence & morbidity

〈有病率〉(=有病割合)と〈罹患率〉の違いを図にまとめました。1年目の時点で 1人が追跡できなくなってしまっている(打ち切り censor となった)ことに御注意ください。2年目の時点で追跡された総人年は,

4人 × 2年 + 1人 × 1年 = 9 人年

となっています。また,2 年目時点では観察人口自体が減っているので,〈有病率〉が1年目と比べて高くなっています。

ことばによる混乱

morbidity には〈罹患率〉という〈率〉の概念に即した訳語がついたのに, prevelence の訳語は「有病者割合」にならず〈有病率〉になってしまった。

これは一体なぜなのでしょうか。

経緯は分かりませんが,ポイントは「有病」や「罹患」という言葉の包含するニュアンスにあると感じます。

「有病」の静的ニュアンス

「有病」という言葉にはそもそも「静的・定点的なニュアンス」があるため,たとえ〈率〉という言葉と合わせられても,静的ニュアンスに引っ張られてしまうのでしょう。

結局は定点的な〈割合〉という定義に落ち着いてしまいます。

「罹患」の動的ニュアンス

一方「罹患」という言葉には「罹患する」という動詞があることからも明白な様に「動的なニュアンス」があります。

やはり「罹患する」「死亡する」といった動的なものは,〈率〉との取り合わせが非常に良い様に思います。

実際〈罹患率〉や〈死亡率〉は,単位が(/人年)となっています。これらは正しく〈率〉になっているのです。

有病”率”だけが明らかにおかしなことになってしまっているのです。

罹患率と有病率の関係性

ちなみに,同一の集団における〈罹患率〉と〈有病率〉との間には,平均罹病期間がほぼ一定であるとき(=感染症など),概ね以下の関係が成り立します。

$$\text{有病率} =\text{罹患率} \times \text{平均罹病期間(ほぼ一定の場合)}$$

なお当然ですが,同一の集団でないもの同士では上記の数式は使えません。

比 ratio

最後に,もう1つ紛らわしい概念を確認しましょう。それが〈比〉です。

【比 ratio】の定義はシンプルです。

【比】:単純に 2つのものの大きさを比較した数値

10人中 6人が男性,4人が女性の場合を考えてみますと,
男女〈比〉= 6÷4 = 1.5 ですが
男性〈割合〉= 6÷10 = 0.6 となります(下図)。

Ratio proportion

こんな簡単なこといちいち説明される必要はねーぞ!と思われるかもしれませんが,「分母に”その集団全体”の数」を要するか要しないか,というのは意外と重要な違いです。

リスク risk は “割合”,オッズ odds は ”比”

〈割合〉と〈比〉の違いは,〈リスク〉と〈オッズ〉の違いにも通じます。

概念的には,リスクは割合,オッズは比,というのがポイントとなります。

〈リスク〉ある団体の中で,その疾患を実際に発症した人の割合

つまり,リスクはその集団に属している人にとっての発症確率と言い換えられます。

いっぽう,オッズは〈比〉です。

より厳密には,

〈オッズ〉ある事象の起こる確率 p と 起こらない確率 1 − p との比 = p / (1 − p)

です。

オッズとリスクの違い:図

Risk and odds

▲ オッズとリスクの違いを図示しました。オッズは罹患する確率(60%)と罹患しない確率(40%)の〈比〉です。リスクは,この群の中で罹患する確率(60%),つまりこの群全体の中での罹患者の〈割合〉です。

オッズ比とリスク比

なお実際に重要となるのは リスクやオッズそのものというよりは,ある介入(ないし危険因子への曝露)によって,そのリスクやオッズが「どの程度変わるか」ということです。

つまり研究で大事な指標は,介入の有無によるリスク”比” relative risk(risk ratio) オッズ”比” odds ratio となります。

合わせて読みたい

クロこの記事では「オッズとは何か」についてまとめるぞ!ミケ「オッズ比」と「リスク比」の違いについても解説しますいきなりまとめ:本項のポイントオッズは〈比〉;あらゆる研究で定義されるリスクは〈割合〉;前向きに[…]

補足
  • ある特定の集団をずっと追いかけ続けてアウトカムの発生”率”を調べるコホート研究や,介入群とコントロール群でのアウトカムの発生”率”を比較する RCT では,追跡・観察した集団の「全体数」と「発症人数」がそれぞれ明確に分かっています。
  • そのため,コホート研究や RCT では「その集団における発症リスク(割合)」を直接的に算出し,それらを比較する(=リスク比を計算する)ことができます。
  • しかし後ろ向き研究では「追跡・観測した集団」というものがなく,リスク比を算出できません。そのためオッズ比で代用することになります(詳細別頁

コラム

クロ

余談だが,オッズは「起きる確率」と「起きない確率」の〈比〉だから,オッズ比は〈比の”比”〉になっているぞ。

シロ

混乱してきたよ〜〜

ミケ

さらにレート比,ハザード比とかいうのもあったりしてね・・

シロ

・・・

クロ

その辺に関してはまた別の記事で扱うぞ!多分な!

まとめ

Pen notes

本頁で扱った内容のまとめ

  • 〈割合 proportion〉 ── 時間的概念を含まない|単位 %
  • 〈率 rate〉 ── 時間的概念を含み,起きる速度を示す|単位 /person-year
  • 〈比 ratio〉 ── 単に 2 つのものの大きさを比較した数値|単位なし
  • 〈罹患率 morbidity〉 ── 本質は〈率〉| 定義通り
  • 〈有病率 prevalence〉 ── 本質は〈割合〉|率なのに!
  • 〈リスク〉 ── 本質は〈割合〉
  • 〈オッズ〉── 本質は(確率の)〈比〉
オッズ,リスクに関しては別記事をご参照ください
合わせて読みたい

クロこの記事では「オッズとは何か」についてまとめるぞ!ミケ「オッズ比」と「リスク比」の違いについても解説しますいきなりまとめ:本項のポイントオッズは〈比〉;あらゆる研究で定義されるリスクは〈割合〉;前向きに[…]

[おすすめ本紹介]

ファクトフルネス FACTFULNESS


ビル・ゲイツが希望者全員に配布したことで有名な世界的超ベストセラー。スウェーデン医師・国際保健学教授である筆者が,誰もが勘違いしている「世界の事実」を1つ1つ挙げながら,本質を歪めて見てしまう人間の本能・バイアスを列挙していきます。脳髄に金槌で釘を打ち込まれるくらいの衝撃を何度も与えてくれる名著です。やや分厚い本ですが,Audible なら通勤時間で聞けてしまうので,大変オススメです。

─ ads ─
>医療統計の解説チャンネル

医療統計の解説チャンネル

スキマ時間で「まるきりゼロから」医療統計の基本事項を解説していく Youtube チャンネルを 2 人で共同運営しています。

CTR IMG