【解説】割合・率・比の違い｜有病率と罹患率

2020年11月1日
2022年8月13日
統計超入門
批判的吟味のために

今回の記事では，特に誤用や誤解の多い〈割合〉と〈比〉と〈率〉の違いについて簡潔にまとめます。

本頁で扱う内容のまとめ

〈割合 proportion〉 ── 時間的概念を含まない｜単位％
〈率 rate〉 ── 時間的概念を含み，起きる速度を示す｜単位 /person-year
〈比 ratio〉 ── 単に 2 つのものの大きさを比較した数値｜単位なし
〈罹患率 morbidity〉 ── 本質は〈率〉｜定義通り
〈有病率 prevalence〉 ── 本質は〈割合〉｜名前は “率” なのに！

1 割合 proportion
2 率 rate
- 2.1 人年法
- 2.2 割合と率の具体例
3 有病〈率〉なのに本当は〈割合〉？
4 比 ratio
5 リスクは “割合”，オッズは ”比”
6 まとめ

割合 proportion

〈割合 proportion〉は，集団全体の中で疾患ないし状態（A）を有する人が占めるところを示したものです。

〈割合〉：ある時点で，全体のうち [A] になっている人の占める部分（％）

ポイントは，「時間的概念を含まない」というところです。

時間を含まない概念ですので，一時点のみで測定を行う様な横断的研究（調査）でも算出が可能です。定点観察でも求められる指標，ということになります。

率 rate

いっぽうで〈率 rate〉は，速度を含む概念です。

〈率〉：単位人年あたりの発症者数（/人年） ※（per person-year）

例えば医学系の RCT でよく用いられるアウトカム（エンドポイント）として，有害事象の〈発生率 incidence rate〉だとか，特定の疾患の〈罹患率 morbidity〉あるいは〈死亡率 mortality rate〉等が挙げられます。

これらは全て，「何人×何年追跡したところ，どのくらいのイベントが発生したか」というものです（人年法）。

人年法

算出方法はシンプルです。

$$\text{率 (rate)} =\frac{\text{イベント数} }{\text{追跡期間×人数の総和（人年）} } $$

という計算式で求めることができます。

尚，ここで分母となる「追跡期間」×「人数」の総和という点に関して，「追跡期間」はそれぞれバラバラでも構いません。

20人を追跡したとして，A さんは 5 年，B さんは 6 年，C さんは 4 年……とバラバラになっていても，その総和を求めれば「観察した（総）人年」が求められます。その「観察した（総）人年」の中で，イベントを観測された人が何人いたか分かれば，後はそれを割って「単位人年あたりのイベント発症者数」を求めるだけです。

この計算結果として，率 rate の単位は（/人年｜ per person-year）となります。単位に「追跡時間」を含む概念であるため，研究方式としては〈前向きの縦断研究〉でなければ測定できません。

※ ランダム化比較試験などの介入研究や前向きコホート研究など

─ ads ─

割合と率の具体例

率 rate と割合 proportion について具体例を挙げて考えてみます。

ある特定時点での調査

たとえば，ある特定のタイミングで調査をしてみたら，施設利用者 100 人の集団の中に 5 人のインフルエンザ患者がいた，という場合を考えてみましょう。

この時，その施設における発症者割合は，

5 ÷ 100 = 0.05

つまり 5 % ということになります。

この様な “ある時点” での数を調べる調査を〈横断研究〉と呼びます。

ある集団を 1 年追跡した調査

一方，ある施設の利用者 100人を 1年間追跡したところ，その１年の間に 5 名がインフルエンザになってしまった，という場合はどうでしょうか。

途中打ち切りは無かったものと仮定します。

このときは，発症率は

$$ \frac{5}{100\text{（人）} \times 1\text{（年）} } =0.05\text{（/人年）} $$

ということになりますし，追跡期間の中での発症者の割合も

$$\frac{5\text{（人）} }{100\text{（人）} } =0.05\text{} =5\% $$

となります。

いずれも 0.05 となり，数字上は違いがありません。

尚，この様に特定集団を追跡する調査を〈前向き縦断研究〉と呼びます。

ある集団を 2 年追跡した調査

では，ここで追跡期間が 1 年ではなく 2 年であった場合はどうでしょうか。

発症者は同様に 100人中の5名であったとします。

この時，発症率は

$$\frac{5}{100\text{（人）} \times 2\text{（年）} } =0.025\text{（/人年）} $$

ということになりますが，その期間中の発症者割合は，

$$\frac{5\text{（人）} }{100\text{（人）} } =0.05=5\% $$

です。

まとめると，以下のようになります（▼）。

$$ \text{発症率} =\frac{\text{発症数：5} }{\text{観測人年：100人×2年} } =0.025 $$

$$ \text{発症割合} =\frac{\text{発症者数：5} }{\text{観測集団の人数：100} } =0.05 $$

先ほどの1年だけ追跡した例とは異なり，〈割合〉と〈率〉で明かに数字に変化が見られます。これは〈率〉という概念が 速度的概念であるからです。

誤用が非常に多い

なお，この〈割合 proportion〉と〈率 rate〉というのは非常に誤用が多いことで有名です。

特に日本では，「有病率」という言葉があるために，さらに混乱を招いているフシがある様に思います。

有病〈率〉なのに本当は〈割合〉？

〈有病率〉という言葉は主に〈Prevalence〉という英語に対してつけられる日本語訳ですが，ここで問題となるのが，〈率〉の意味合いです。

〈有病率〉の定義を辞書で確認してみますと，

有病率：ある一時点において，実際に疾病を有している人の〈割合〉

となっています。

つまり名前には〈率〉とあるのに，実質的には速度の概念を含まない概念 ──〈割合〉── なのです。完全に矛盾してしまっています。

$$\text{有病率} =\frac{\text{その集団内で，ある一時点において疾病を有する者の数（人）} }{\text{観察集団の全人口（人）} }$$

この言葉のせいで，もともと誤用の多い〈割合〉と〈率〉について，さらなる混乱を招いている様に感じます。

〈有病率〉（＝有病者割合）は，『ある特定時点での，観測集団内の健康問題の大きさ』をはかる横断的、、、な指標です。「いま」「まさに」この人口の中にどのくらいの患者さんがいるか（という”割合”）を知ることで，行政が施策を練る際に有用です。

罹患〈率〉は，ちゃんと〈率〉

一方〈罹患率 morbidity〉は一定期間にどれだけの疾病（健康障害）者が発生したかという〈速度〉を加味した概念です。

罹患率：一定期間にどれだけの疾病（健康障害）が発生したか（/10万人年）

こちらは有病率と異なり，ただしく定義通りの〈率〉であるというわけです。

$$\text{罹患率} =\frac{\text{観察期間のあいだに新規発生した患者数（人）} }{\text{観察された「人年」の総和（人年）} }$$

罹患率が使われる場面

罹患率は，疫学的観点で非常に重要な指標です。

例えば，ある地方自治体で，ある特定の疾患の罹患率を計測し続けたとき，ある時点から突然その罹患率が上昇した，ということがわかったとします。

言い換えればこれは，その特定の疾患が発生する速度が速くなった，ということです。そうすると，何かその裏に発生要因があるのでは？という推論が可能となり，実際に現地調査を行うきっかけとなります。

罹患率が上がるときには，なにかその裏に隠された原因（発生要因）がある場合が多いからです。

水道会社 A を使っている世帯でコレラの罹患率（死亡率）がめちゃくちゃ高く，水道会社 B を使っている世帯ではそうでもない，と気づいたジョン・スノウ医師（1813-1856）は疫学の父と呼ばれています。

有病率と罹患率まとめ

まとめると，以下のようになります（▼）。

有病率と罹患率の違い
Prevalence & morbidity

1年目の時点で 1人が追跡できなくなってしまっていること（打ち切り censor）に注意。2年目の時点で追跡された総人年は「4人 × 2年＋ 1人 × 1年＝ 9 人年」となっている。また，2 年目時点では観察人口自体が減っているので〈有病率〉が1年目と比べて高くなっている。

ことばによる混乱

ところで prevelence の訳語が「有病者割合」にならず〈有病率〉になってしまったのは一体なぜなのでしょうか。本当の経緯は存じませんが，個人的には「有病」や「罹患」という日本語が包含するニュアンスに問題があったのではと思っています。

「有病」の静的ニュアンス

「有病」という言葉にはそもそも「静的・定点的なニュアンス」があるため，たとえ〈率〉という言葉と合わせられても，静的ニュアンスを引っ張ることができてしまうのでしょう。

そのため有病「率」と言いながら結局は定点的な〈割合〉としての定義でまかり通ってしまっています。

「罹患」の動的ニュアンス

一方「罹患」という言葉は「罹患する」という動詞があるように「動的なニュアンス」を持っています。

「罹患する」「死亡する」といった動的なものは，もともと〈率〉という概念との取り合わせが非常に良いわけです。実際〈罹患率〉や〈死亡率〉は，単位が（/人年）となっており，これらは正しく〈率〉の概念に即しています。

残念ながら「有病”率”」だけが明らかにおかしなことになってしまったのは，日本語のニュアンスの問題が大きいと感じます（私見です）。

罹患率と有病率の関係性

ちなみに，同一集団における〈罹患率〉と〈有病率〉との間には，平均罹病期間がほぼ一定であるとき（＝感染症など），概ね以下の関係が成り立します。

$$\text{有病率} =\text{罹患率} \times \text{平均罹病期間（ほぼ一定の場合）}$$

※当然ですが，同一の集団でないもの同士では上記の数式は使えません。

比 ratio

最後に，もう１つ紛らわしい概念を確認しましょう。それが〈比〉です。

〈比 ratio〉の定義はシンプルです。

〈比〉：単純に 2つのものの大きさを比較した数値

10人中 6人が男性，4人が女性の場合を考えてみますと，
男女〈比〉＝ 6÷4 ＝ 1.5 ですが
男性〈割合〉= 6÷10 ＝ 0.6 となります（下図）。

こんな簡単なこといちいち説明される必要はねーぞ！と思われるかもしれませんが，「分母に”その集団全体”の数」を要するか要しないか，というのは意外と重要な違いです。

リスクは “割合”，オッズは ”比”

〈割合〉と〈比〉の違いは，〈リスク risk〉と〈オッズ odds〉の違いにも通じます。基本的にリスクは割合，オッズは比の概念だからです。

〈リスク〉ある集団の中で，そのイベントを実際に起こした人の割合

〈オッズ〉ある事象の起こる確率 p と起こらない確率 1 − p との比＝ p / (1 − p)

オッズとリスクの違い：図
Risk and odds

オッズは罹患する確率（60%）と罹患しない確率（40%）の〈比〉。リスクは，この群の中で罹患する確率（60%），ここではそのまま罹患者の〈割合〉です。

オッズ比とリスク比

なお実際に臨床上重要なのはリスクやオッズそのものというより，ある介入（ないし危険因子への曝露）によってそのリスクやオッズが「どの程度変わるか」ということです。

つまり介入（曝露）の有無によるリスク比、 relative risk（risk ratio） や オッズ比、 odds ratio が大切な指標となります。

合わせて読みたい

オッズとは何か？オッズ比とリスク比の違い｜やわらか統計学

この記事では「オッズとは何か？」「オッズ比とリスク比の違いは何か？」についてまとめます。いきなりまとめ：本項のポイントオッズは〈比〉；あらゆる研究で定義されるリスクは〈割合〉；前向きに「追跡される集団」がなければ定義できない […]

｜前向き研究でなければリスク比は出し難い

ある特定の集団をずっと追いかけ続けてアウトカムの発生”率”を調べるコホート研究や，介入群とコントロール群でのアウトカムの発生”率”を比較する RCT では，追跡・観察した集団の「全体数」と「発症人数」がそれぞれ明確に分かっています。
そのため，コホート研究や RCT では「その集団における発症リスク（割合）」を直接的に算出し，それらを比較する（＝リスク比を計算する）ことができます。
しかし後ろ向き研究では「追跡・観測した集団」というものがなく，リスク比を算出できません。そのためオッズ比で代用することになります（詳細別頁）

コラム

クロ

余談だが，オッズは「起きる確率」と「起きない確率」の〈比〉だから，オッズ比は〈比の”比”〉になっているぞ。

シロ

混乱してきたよ〜〜

ミケ

さらにレート比，ハザード比とかいうのもあったりしてね・・

シロ

・・・

クロ

その辺に関してはまた別の記事で扱うぞ！多分な！

まとめ

Pen notes

本頁で扱った内容のまとめ

〈割合 proportion〉 ── 時間的概念を含まない｜単位％
〈率 rate〉 ── 時間的概念を含み，起きる速度を示す｜単位 /person-year
〈比 ratio〉 ── 単に 2 つのものの大きさを比較した数値｜単位なし
〈罹患率 morbidity〉 ── 本質は〈率〉｜定義通り
〈有病率 prevalence〉 ── 本質は〈割合〉｜率なのに！
〈リスク〉 ── 本質は〈割合〉
〈オッズ〉── 本質は（確率の）〈比〉

オッズ，リスクに関しては以下の記事をご参照ください