ベイズの定理

2019年7月5日
確率というものは私たちの生活を支配しています。私たちは気づかぬうちに毎日これを使っているのです。この記事では、中でも最も重要な定理の一つ、ベイズの定理についてお話ししていきます。

ベイズの定理は、確率論の柱の一つですその名前は、18世紀にその理論を提唱したトーマス・ベイズ(1702-1761)に由来します。しかしこの科学者が説明しようとしたことは正確には何だったのでしょうか?ウェブスター辞典によれば、確率とは、”考え得る結果の合計数に対する、等しく起こり得る結果の集合の中の所定の事象を生み出す結果の数の比率”だそうです。

確率というのは、私たちの世界を支配しています。例えば病院に行けば、医者は患者を治療できる可能性が最も高いものを処方しますよね。さらに、広告主は自分たちのキャンペーンの対象を、宣伝したい製品を買ってくれる可能性が最も高そうな人々に絞ります。もっと言うと、通勤コースは一番時間がかからないであろうルートを選びますよね。

全確率の公式

確率法則の中でも最も有名なものの一つが全確率の公式です。この全確率の公式とは何なのかを分析することはとても重要です。これを理解するために、ある例をご紹介します。

ある国では、市民の39%が女性であるとしましょう。そして女性のうち22%、男性の14%が無職だとします。では、この国の労働力人口の中から無作為に選ばれた1人の人物が無職(P(U))である確率(P)は何になるでしょうか?

ベイズの定理

確率論に従うと、その確率は以下のように表すことができます:

  • その人物が女性である確率:P(W)
  • その人物が男性である確率:P(M)

39%の市民が女性であることがわかっているので、P(W) = 0.39であると推定できます。

従って、次のように割り出すことができます:P(M) = 1 – 0.39 = 0.61

また、この問題には条件付き確率も与えられています:

  • ある女性が無職である確率:P(U | W) = 0.22
  • ある男性が無職である確率:P(U | M) = 0.14

従って、全確率の公式に従うと、以下のようになります:

P(U) = P(W)P(U | W) + P(M)P(U | M)

P(U) = 0.22 × 0.39 + 0.14 × 0.61

P(U) = 0.17

つまり、無作為に選ばれた人物が無職である可能性(P(U))は0.17となります。この結果が二つの条件付き確率の間に挟まれていることがお分かりいただけると思います(0.14 < 0.17 < 0.22)

ベイズの定理

では、フォームに記入するために無作為に選んだ人物が無職だったことに気づいたことにしましょう。この場合、また、前回の例を考慮に入れると、この無作為に選ばれた人物が女性である確率([P(W | U)])は何になるでしょう?

この問題を解くには、ベイズの定理を適用しなければなりません。特に、この事象についてすでに持っている情報を考慮した上でその事象の確率を計算する際にこの定理が必要になります。事象Aの確率を計算することも、またその確率に影響を与える特定の性質(B)を事象Aが満たすことも分かるのです。

この場合、ここで話している確率は無作為に選んだ人物が女性であるというものです。しかし、この確率はその人物が職を持っているかどうかという事実からも独立していません。

ベイズの定理の公式

その他の定理と同様に、確率を計算するための公式が必要になります:

ベイズの定理

一見難しく見えますが、全て説明が可能です。

  • まず、Bはすでに情報を持っている事象です。
  • 一方で、A(n)は異なる条件の事象を指します。
  • 分子には条件付き確率があります。これは何か(事象A)が、別の事象(B)も起こるとわかっている状態で発生する確率を指します。これをP(A | B)と定義し、’Bを前提にしてAが発生する確率’と表現します。
  • 分母には、P(B)と同等のものが入ります。
ベイズの定理

一例

先ほどの例に戻ると、ある質問票に記入するために無作為に1人を選び、その人物が無職であることに気づくという設定でした。この人物が女性である確率([P(W | U)])は何になるでしょうか?

前述の例を考慮に入れると、労働力人口の39%が女性であることがわかっています。ですので、残りの人口が男性であることがわかり、無職の女性が22%で男性が14%であることもわかっています。

また、無作為に無職の人物を選ぶ確率が0.17であることもわかっています。ですので、ベイズの定理を適用すると、無職の人々の中から無作為に選ばれた人物が女性である確率は0.5となります。

P(W | U) = (P(W) * P(U | W) / P(U)) = (0.22 * 0.39) / 0.17 = 0.5

確率に関してよく誤解されてしまうことについて触れ、この記事を締めくくりたいと思います。確率は、0と1の間の数にしかなりません。ある事象の確率が0だった場合、それは決して起こり得ない、という意味です。一方で、確率が1であれば、必ず起こるということになります。

  • 4. PROBABILIDAD CONDICIONADA Y EL TEOREMA DE BAYES. Retrieved from http://webcache.googleusercontent.com/search?q=cache:0EF2amyeIKMJ:halweb.uc3m.es/esp/Personal/personas/mwiper/docencia/Spanish/Teoria_Est_El/tema4_orig.pdf+&cd=13&hl=es&ct=clnk&gl=es&client=firefox-b-ab
  • Díaz, C., & de la Fuente, I. (2006). Enseñanza del teorema de Bayes con apoyo tecnológico. Investigación en el aula de matemáticas. Estadística y Azar.
  • Teorema de Bayes – Definición, qué es y concepto | Economipedia. Retrieved from https://economipedia.com/definiciones/teorema-de-bayes.html