今回は確率統計の確率分布をまとめます🐜
離散型確率変数では二項分布、ポアソン分布、幾何分布を扱い、連続型確率変数では一様分布、指数分布、正規分布を扱います。また、それぞれがどんな確率変数であるときに現れるのか、できるだけ具体例をあげて整理します。
二項分布
定義
を(離散型)確率変数、を自然数、とする。このとき、確率関数が次式で定まる確率分布を二項分布という。
とくにのとき、ベルヌーイ分布と呼ぶ。
平均と分散
確率変数が二項分布に従うとき、平均と分散は次式となる。
例
確率変数が二項分布に従う具体例は以下の通り。
試行を独立に繰り返すとき、ある事象が起こる回数
- サイコロを無作為に回ふるとき、「1」の目が出る回数
- 的に当たる確率が一定のとき、回独立にダーツを投げて的に当たる回数
- ミスしない確率が一定のとき、5回独立に演奏してミスしない回数
ランダムサンプルの中で、ある特性をもつ個体数
- 無作為に選んだ人のうちの、現内閣支持者数
- 無作為に選んだ世帯のうちの、ある番組をみた世帯数
- 無作為に選んだ個の製品のうちの、不良品数
ポアソン分布
定義
を(離散型)確率変数、とする。このとき、確率関数が次式で定まる確率分布をポアソン分布という。
平均と分散
確率変数がポアソン分布に従うとき、平均と分散は次式となる。
例
確率変数がポアソン分布に従う具体例は以下の通り。
ある条件下で大量観測地にまれな現象(事象)が起こる回数
(ある条件とは「1回の観測で現象が起こる確率が一定で、各観測時の現象の生起が独立であること」である)- 5ページあたりのミスプリント箇所数
- チケットのキャンセル者数
- ある売り場での宝くじの高額当選者数
ある条件下で時間経過や空間の広がりにより、特定の現象が起こる回数
(ある条件とは「時間または空間を細かく等分割したとき、各分割区間(領域)で現象が起こる回数は1か0であり、現象が起こる分割区間(領域)が二項分布に従うこと」である)- 一定時間内に、ある番号にかかってくる電話の本数
- 一定時間内に、ある窓口に訪れる来客者数
- あるエリアに生えている野草の数
二項分布のポアソン近似
確率変数が二項分布に従い、でが大きくないとき、は近似的にポアソン分布に従う。
が大きくない目安は、とする。
「でが大きくない」条件は、「」でもよい。
幾何分布
定義
を(離散型)確率変数、とする。このとき、確率関数が次式で定まる確率分布を幾何分布という。
平均と分散
確率変数が幾何分布に従うとき、平均と分散は次式となる。
例
確率変数が幾何分布に従う具体例は以下の通り。
- 試行を独立に繰り返すとき、ある事象が初めて起こるまでにかかる回数
- サイコロを無作為にふるとき、初めて「1」の目が出るのが回目
- 射的の成功率がのとき、的に当てて景品をもらえるまでの回数
一様分布
定義
を(連続型)確率変数、実数をとする。このとき、確率密度関数が次式で定まる確率分布を一様分布という。
ただし、連続型確率変数では区間の端点の有無は確率に影響しないことに注意すること。
平均と分散
確率変数が一様分布に従うとき、平均と分散は次式となる。
例
確率変数が一様分布に従う具体例は以下の通り。
- がある区間の値をとり、一様の起こりやすさがあるとき
- 10分おきに発車する地下鉄に、無作為に到着したときの待ち時間
- 無作為に与えられた数値の、四捨五入(丸めこみ)の誤差
指数分布
定義
を(連続型)確率変数、とする。このとき、確率密度関数が次式で定まる確率分布を指数分布という。
ただし、連続型確率変数では区間の端点の有無は確率に影響しないことに注意すること。
平均と分散
確率変数が指数分布に従うとき、平均と分散は次式となる。
例
確率変数が指数分布に従う具体例は以下の通り。
- ある条件下で時間経過により特定の現象が起こる時間間隔
(ある条件とは「過去の結果に影響されない」こと、「ある時間何に起こる確率が、その時間区間の幅に比例する」ことである)- ある時間帯に客がくる時間間隔
- ある時間帯に路上でタクシーを待つ時間
- 製品の故障間隔(修理により同じ状況が保てる場合)
正規分布
定義
を(連続型)確率変数、を実数、とする。このとき、確率密度関数が次式で定まる確率分布を正規分布という。
とくにのとき、標準正規分布という。
平均と分散
確率変数が正規分布に従うとき、平均と分散は次式となる。
例
確率変数が正規分布に従う具体例は以下の通り。
二項分布の正規近似
がに従うとき、ならばは近似的にに従う大標本での標本平均、標本比率
経験上(過去のデータから)正規分布に従うとみなされる確率変数
たとえば、試験の点数、身長、実験の測定誤差/観測誤差など
おわりに
機械学習の本を読んでると、なんでもかんでも正規分布にしてしまうような気がしていたので、今回分布ごとにその分布が従う例を整理しました。個人的にはすごくすっきりしてよかったです。
参考になれば幸いです(^^)
以下では、確率統計の基本レベルを整理していますので、よろしければご覧ください。
Probability statistics カテゴリーの記事一覧 - ari23の研究ノート
参考文献
参考文献は以下の通りです。
- 第4版 理工系の確率・統計入門
統計の基礎がとても丁寧にわかりやすく書かれています。入門書としてオススメです。