統計学基礎/確率

確率の導入

確率とは

確率という言葉は, 今日ではいろいろな場面で使われる. 降水確率や, 合格確率, 事故の起きる確率, 宝くじの当選確率などその使われ方は多岐に渡る. 大抵の場合確率何％（パーセント）というように, パーセント表示されるが, ％とは本来per centつまり100あたりいくらか？という値を示す記号である. 例えば, 降水確率で考えてみると, 降水確率40％とは, 同じような天気図になった日が100日あったとしたら, その内40日は雨が降るということになる. 100日あたり40日ということは, 1日あたり 40/100=0. 4 の割合で起きていることになる. 必ず雨が降ると言われている100％であれば, 100÷100=1の割合で起きるということで, 必ず降らないと言われる0％であれば, 0÷100=0 の割合で起きるという予測になる. つまり確率というのは0から1までの値を取る.

確率というのはこのように「ある物事が起こる割合」として考えられる.

割合と確率

標本空間で定義したとおり, 標本空間や事象というのは「起こりうる結果（標本点）の集合」だった. ある事象Aが起こる確率 P(A) とは, 実験を沢山繰り返した時に, Aが起こる割合の事である.

例えば, コイン投げであれば, 表が出る確率は1/2である. 1回コインを投げて表が出たとすると, 全1回の試行中, 1回表が出たので, 表が出た割合は1÷1=1になる. もう1回投げて, また表が出たとすると, 表が出ている割合は2÷2=1である. 全然, 1/2と違うのではないか？と思われるかも知れない. しかし重要なのは「沢山」繰り返した時にということである. コイン投げを10回,100回と繰り返すと、限りなく1/2に近づくのである。

確率の公理

記号の定義

Ωを標本空間, Aを事象とする.

P(x) は, 事象 x を独立変数とし, 実数値を取る関数とする.

A₁, A₂, …は事象の列とする.

確率の公理

次の3つの式の事を確率の公理という.

P₁ : 任意の事象Aに対し 0 ≤ P(A) ≤ 1

P₂ : P(Ω)=1

P₃ : A₁, A₂, … が互いに背反事象であるとき

P(\bigcup _{k=1}^{\infty }A_{k})=\sum _{k=1}^{\infty }P(A_{k})

( σ-加法性)

これらの性質を持つ P(x) の事を確率（確率測度）という. 最初についてる P₁ , P₂ , P₃ は, これから説明するための便宜上の番号である.

P₁ の式は, 確率は 0 から 1 までの値を取るという意味である. 説明したとおり確率というのは, 実験回数に対してその事象が起きている「割合」である. 世の中には「合格確率 120 ％」のような変な言葉もあるが, 同じような実力の人が 100 人集まって入学試験などを受験して 120 人合格するなどという変なことはない. 100 人しか受験していないのなら, 合格する人数の最大値も 100 人ですし, 割合の最大値も 1 である.

P₂ の式を見てください. 標本空間 Ω は起こり得る全ての結果の集合なので, 実験を何度繰り返しても, Ω に含まれる標本点のうちのどれか 1 つが「必ず」起きている. したがって, 標本空間という事象が起きる確率は 1 となる.

P₃ の式が一番分かりにくいかもしれない. 「 σ -加法性（しぐまかほうせい）」という難しい名前もついている.

総和記号が分かりにくいと思う人は

P(A₁ ∪ A₂ ∪ … )=P(A₁)+P(A₂)+…

という式だと思うとよい.

背反事象とは何だったか思い出すと, A_j ∩ A_k = φ の時, 即ち, A_jと A_kに重なりが無いとき, この A_jと A_kは背反事象になる. 互いに背反とはどういう意味なのかといえば, j ≠ k の時 A_jと A_kが背反事象, 即ち, どの 2 つの事象を取ったとしても, 互いに重ならないという意味である.

左辺にある $\bigcup _{k=1}^{\infty }A_{k}$ はA_kに重なりが無いので, それぞれのA_kに含まれる標本点は, この和集合を取るという操作で重なり無く足され, $\bigcup _{k=1}^{\infty }A_{k}$ という一つの集合になる. 右辺は, 各A_kに与えられた確率P(A_k)をそのまま足しなさいという意味である. 重なりが無いからこそ足せるのである. 重なりがあると簡単には足せない.

背反事象で無い場合の確率の和の取り方は, また後ほど説明する.

確率の応用

たった3つの確率の公理からいろいろな事が分かる.

空事象の確率

まず A₁ = Ω ととり, k ≥ 2 のときは A_k = φ とする. この時, P₃ の式は

P(Ω)=P(Ω)+P(φ)+P(φ) …

だから, P₁ , P₂ の条件より, P(φ )=0 とわかる.

P₃ の条件について少し補足する. 任意の事象xに対して x ∩ φ = φ である. つまり, 空事象と他の事象の共通部分（積事象）は, 空事象である. 空事象同士の共通部分も空事象である. これは, 空事象と任意の事象xは背反事象であることを示している. したがって, P₃ の条件を満たし, P₃ の式が使えるということになる.

有限加法性

まずは, P(φ )=0 という式が得られた. これから, P₃ の式についてもう少し条件を厳しくして k > n のときは A_k = φ とすると, P₃ は次のように書き換えられる.

P₄ : A₁, A₂, … , A_n が互いに背反事象であるとき

P(\bigcup _{k=1}^{n}A_{k})=\sum _{k=1}^{n}P(A_{k})

（有限加法性）

k > n のときは, P(A_k )= P(φ) =0 であることを使った. なんだか回りくどいことをしてると思われるかもしれないが, 数学では最初に決めておく約束事は少ない方がよく, その少ない約束事からいかに多くの事実を導き出せるか？ということが数学の面白さでもある.

差事象と補事象

差事象 A - B について (A - B) ∪ (A ∩ B) = A かつ (A - B) ∩ (A ∩ B) = φ なので

P(A)=P(A - B)+P(A ∩ B)

P(A - B)=P(A)-P(A ∩ B)

となる.

ここで, A ⊇ B であれば A ∩ B=B なので

P(A)=P(A - B)+P(B) ≥ P(B)

となる.

また, A = Ω であれば, 差事象 Ω - B は, 事象Bの補事象 B^c の事なので

P(B^c)=P(Ω)-P(B) = 1-P(B)

となる. ここまで来て, 勘の良い方は気付くかも知れないが

P(B^c)= 1-P(B) ≥ 0

より

P(B) ≤ 1

である. この不等式を導くまで, P₁ の不等式 0 ≤ P(A) ≤ 1 は, 左側の不等号しか使ってないことに注目すると, P₁ の右側の不等号は余分ということで, P₁ は次のようにも書き換えられる.

P₁′: 任意の事象Aに対し P(A) ≥ 0

和事象

A ∪ B = (A - B) ∪ B かつ (A - B) ∩ B = φ ですから和事象 A ∪ B について

P(A ∪ B) = P(A - B)+P(B) = P(A)+P(B)-P(A ∩ B)

となる. この式は加法定理とも呼ばれる.

特にAとBが背反事象であるときにP(A∩B)=P(φ)=0 なので, これは有限加法性 P₄ の式になる.

条件付き確率

定義

P(A)>0 のとき

P(B|A)={\frac {P(A\cap B)}{P(A)}}

を条件付き確率という.

P(B|A)は, 全事象をΩ からAに取り替えたときの事象Bの起きる確率と考えることができる. 即ち, P(B|A)は事象Aが必ず起きるという条件の元での事象Bの起きる確率である.

このとき, Aは全事象と考えるのだから

P(A|A)={\frac {P(A\cap A)}{P(A)}}={\frac {P(A)}{P(A)}}=1

である. これは, 確率の公理の P₂ に当たる式になる. Aを固定したとき P(x|A)という関数が P₁ や P₃ も満たし, 確率となることが分かる.

乗法定理

定義式の分母を払った等式

P(A∩ B) = P(A)P(B|A)

を乗法定理と言う. 条件付き確率の定義では P(A)>0 を仮定したが, このように見てみると P(A) ≥ 0 に拡張しても問題ないと分かる. 定義の項では, 何故このような細かい条件をつけたりしたのかと言えば, 割り算において 0 で割るという操作は認められてないためである. 分数の分母に 0 が来ることは避けなければならない.

独立性

事象AとBが

P(A ∩ B)=P(A)P(B)

を満たすときAとBは独立であると言う.

0< P(A)<1 のとき

P(B|A)={\frac {P(A\cap B)}{P(A)}}=P(B)

となる. ここで,

P(A^c∩ B) = P(B)-P(A∩ B)

= P(B)-P(A)P(B) = (1-P(A))P(B)

= P(A^c)P(B)

となるので結局

P(B|A^{c})={\frac {P(A^{c}\cap B)}{P(A^{c})}}=P(B)

つまり, Bの起きる確率はAが起きたかどうかに寄らないということである. P(A) = 1 or 0 の時は, A が必ず起きたり, 必ず起きなかったりするので, この場合 B の起きる確率と A は関係しない.

ベイズの定理

見た目が全く同じ箱が 2 つある. 箱1 と箱2とする.

箱1には赤玉が 9 個, 白玉が 1個

箱2には赤玉が 2 個, 白玉が 8個

入っているとする. どちらの箱か分からないが, 手を入れて玉を一つだけ取りだしてみると赤い玉だった. この場合, 選んだ箱が箱1である確率はいくつだろうか？箱を選ぶ確率はどちらも等しく(1/2) であるとする. 箱1の方が赤玉が出やすそうであるので, 箱1の方を選んでいた可能性は高そうだろう. すなわち, 赤玉が出たという事が決定した後では, 箱1と箱2のどちらを選んだか？という確率は等しくなさそうである. このような確率をどのように調べたらいいだろうか？というのがこの節の目的である.

B₁, B₂, … , B_n が互いに背反事象で, B₁∪B₂∪…∪B_n = Ωであるとする.