代表的な確率分布、二項分布(離散確率分布)と正規分布(連続型確率分布)の確率計算方法について
二項分布(離散確率分布)は、結果が2パターンしかない時の確率分布
成功・失敗、コインの裏表、サイコロ6の目orそれ以外など
コイントス100回は、B(100, 0.5)のように書く
B(n, p) = 二項分布(試行回数, 成功確率)
平均の求め方
μ = np
平均 = 試行回数×成功確率
コイントス100回なら、100×0.5 = 表50回が平均(期待値)
分散の求め方
s^2 = np(1-p)
分散 = 試行回数×成功確率×失敗確率
コイントス100回なら、100×0.5×0.5 = 25
標準偏差は、√25 = 5
なので、コイントスを100回すると、以下のような確率分布になる。
平均50回±5(表45回~55回)が68%(標準偏差1個分)
平均50回±10(表40回~60回)が95%(標準偏差2個分)
平均50回±15(表35回~65回)が99.7%(標準偏差3個分)
二項分布の別の例
B(5, 0.2) は、成功確率20%を5回やる、という意味
P(X=3)は、二項分布の場合、5回中、成功がちょうど3回の確率は?という意味(これ、どこにも説明なかったのだが…。)
平均μ = 5 * 0.2 = 1
分散s^2 = 5 * 0.2 * 0.8 = 0.8
標準偏差は、√0.8 = 0.894
P(X=3) = 5C3 * 0.2^3 * 0.8^2 = 0.0512(5.12%)
正規分布(連続型確率分布)は、結果が無限パターンある時の確率分布
正規分布表を使って、確率を出す。
平均値60、分散25は、N(60, 5^2)のように書く(標準偏差は二乗の状態で書く。ルートより掛け算の方が楽だから?)
N(μ, s^2) = 正規分布(平均値, 分散)
P(X >= 65) は、65以上の確率を表す。
計算方法は、Z値を求めて、正規分布表を参照して、確率を算出する。
Z値 = (Xの値 – 平均値) / 標準偏差
※例によって、標準偏差何個分かを計算している。
Z = (65 – 60)/5 = 1
なのでZ=1.0の値を正規分布表をみると、0.1587なので、
平均点60点&標準偏差5点の場合
65点を取っている人は上位15.87%(偏差値60)
70点を取っている人は上位2.28%(偏差値70)
75点を取っている人は上位0.13%(偏差値80)
逆に65点以下の人は、1 – 0.1587 =0.8413(84.13%)いる
P(55 <= X <= 65)みたいに、範囲でもOK
プラスマイナス標準偏差1個分なので、1 – 0.1587*2 =0.6826(68.26%)が入る(普通の人)
二項分布の正規近似
二項分布も、正規分布表を使って、成功確率を計算できる。
B(700, 0.4) = 成功確率40%を700回やる。
P(X >= 300) = 300回以上の成功確率
平均値μは700*0.4=280回
分散S^2 = 700*0.4*0.6=168
N(μ, s^2) = 正規分布(平均値, 分散)なので、N(280, 168)として計算できる!
Z値 = (Xの値 – 平均値) / 標準偏差だから
Z = (300 – 280)/12.96 = 1.54
正規分布表をみると、0.063だから
300回以上の成功確率は、6.3%