PSM

Pプログラミング S初心者の Mメモ書き

大数の法則

1 はじめに

中心極限定理について直感ではいまいち納得できなかったのでちょっとまとめようとおもったのですが,その前にまず大数の法則についてまとめてみます.

wikipedia先生に中心極限定理について聞いてみます.

大数の法則によると、ある母集団から無作為抽出された標本平均はサンプルのサイズを大きくすると真の平均に近づく。これに対し中心極限定理は標本平均と真の平均との誤差を論ずるものである。多くの場合、母集団の分布がどんな分布であっても、その誤差はサンプルのサイズを大きくしたとき近似的に正規分布に従う。

wikipedia:中心極限定理
さて,中心極限定理について聞いたのに大数の法則というのが出てきました.

2 大数の法則とは?

大数の法則が言っているのはあたりまえのことでした.
世の中のたいていの事象は無限に存在するので,その全てを調べ尽くすことは不可能に等しい行為です.
例えば卵にはたまに黄味が2つ入っているのがあります.
しかし黄味が2つ入っている確率を求めたいとして,そのためにこの世の全ての卵を調べようなんてのは無理な相談です.(こうしている間にも鶏は卵を産み続けます)
そこでほとんどの人が思いつく方法が,だいたい1,000個とか頑張って10,000個とかの卵を調べて,その中の黄味が2つある卵を数え,それでとりあえず確率を出して満足しておこうというものでしょう.
これがまさに大数の法則の考え方となります.
自分が調べることのできる量(=1000個)なんて全体の量(=世界中の卵の数)からみたら本当に微々たるものにすぎませんが,それでも結構信頼の高い確率を得ることができるということです.
これを指して,大数の法則は「経験的確率と理論的確率が一致する」ことを示すものだと言ったりもします.
また,ここで信頼性という面で大事なのは自分が”何個”調べたかであって,”何%”調べたかではないというところに注意が必要です.

大数の法則が現実に使われている例としては,選挙速報やTVの視聴率調査があります.
これらはほとんど現実の値から外れることはありませんが,現実にすべての投票者.すべてのTVのある家庭に対して調査を行っているわけではありません.
一部の家庭や有権者を調べるだけで,全体の動向もだいたいわかってしまうものなんですねえ.