確率分布の期待値と分散


確率分布と,その期待値・分散といった指標の定義についてのメモ.本当に詳細な定義をしようとすると,測度論が必要な場面もあるので,素朴な定義からのスタートで.

スポンサーリンク

確率分布

Def 1.1
n 個の値 x_1,x_2,\ldots,x_n をとる変数 X に対して,X = x_i となる確率 p_i が与えられているとき,X を 確率変数 という.また,p(x_i) = p_i を満たすような確率 p_i と確率変数 X との対応関係 p を 確率分布 という.ただし,x \notin X のときは p(x) = 0 とする.
コメント

条件 c を満たす確率を単に p(c) と表す.たとえば X = x_i となる確率は

    \[ P(X = x_i) = p_i = p(x_i) \]

などと表すことができる.
コメント

確率変数 X の取る値が有限または加算無限個(数えられる程度の無限大)であるとき X は 離散型,X がある区間内のすべての実数を取るとき(数えられない程度の無限大)連続型であるという.

各変数に対して確率が与えられている.確率の和は1であったから,次の式が成り立つ.

離散型

    \[ \sum_{x \in X}p(x) = 1 \]

連続型

    \[ \int_{-\infty}^{\infty}p(x)\,dx = 1 \]

連続型の場合は,ある区間 [a,b] での確率分布だったとしても,この区間の外では p(x) = 0 になることを考えればこの表現に問題はない.この性質を 正規性 といったり,あるいは確率分布 p は正規化されている などという.

期待値・分散

Def 1.2
p を確率分布とする.p の関数 \varphi : X \longrightarrow \mathbb{R} に対する期待値を \mathbb{E}[\varphi(x)] と表し,p が離散型のときは

    \[ \mathbb{E}[\varphi (x)] = \sum_{x \in X}p(x)\varphi (x) \]

連続型のときは

    \[ \mathbb{E}[\varphi (x)]= \int_{-\infty}^{\infty}p(x) \varphi (x) \,dx \]

で定める.

コメント

Prop 1.3

    \[ \mathbb{E}[1] = 1. \]

証明

Prop 1.4(期待値の線形性)
関数 \varphi, \psi : X \longrightarrow \mathbb{R}a,b \in \mathbb{R} について,次が成り立つ.

    \[ \mathbb{E}[a\varphi + b\psi ] = a\mathbb{E}[\varphi ] + b \mathbb{E}[\psi ] \]

証明

Def 1.5
p を確率分布とする.関数 \varphi:X \longrightarrow \mathbb{R} の 分散 を {\rm var}[\varphi] と表し,

    \[ {\rm var}[\varphi] = \mathbb{E}\bigl[(\varphi - \mathbb{E}[\varphi])^2\bigr] \]

で定める.

コメント

Th 1.6
確率分布 p に対して,次が成り立つ.

    \[ 	{\rm var}[\varphi] = \mathbb{E}[\varphi^2] - \mathbb{E}[\varphi]^2 \]

証明

とくに断りがないときには,期待値・分散は \varphi (x) = x の場合について考えるものとする.


スポンサーリンク