Гипергеометрическое распределение - дискретное распределение вероятностей случайной величины
ξ
{\displaystyle \xi}
, принимающей целые неотрицательные значения
k
=
0
,
1
,
…
,
n
{\displaystyle k=0,1,\ldots ,n}
с вероятностями
p
k
=
P
(
ξ
=
k
)
=
C
N
p
k
C
N
(
1
−
p
)
n
−
k
C
N
n
,
{\displaystyle p_{k}=\mathbf {P} (\xi =k)={\frac {C_{Np}^{k}C_{N(1-p)}^{n-k}}{C_{N}^{n}}},}
где
N
{\displaystyle N}
,
p
{\displaystyle p}
,
n
{\displaystyle n}
— параметры,
(
0
<
p
<
1
)
{\displaystyle (0<p<1)}
.
Характеристическая функция [ ]
φ
(
t
)
=
[
N
(
1
−
p
)
]
[
n
]
N
[
n
]
∑
l
=
0
n
[
N
p
]
[
l
]
n
[
l
]
e
i
l
t
[
N
(
1
−
p
)
−
n
+
l
]
[
l
]
l
!
,
{\displaystyle \varphi (t)={\frac {[N(1-p)]^{[n]}}{N^{[n]}}}\sum _{l=0}^{n}{\frac {[Np]^{[l]}n^{[l]}e^{ilt}}{[N(1-p)-n+l]^{[l]}l!}},}
где
C
[
l
]
=
C
(
C
−
1
)
(
C
−
2
)
…
(
C
−
l
+
1
)
;
{\displaystyle C^{[l]}=C(C-1)(C-2)\ldots (C-l+1);}
φ
(
t
)
{\displaystyle \varphi(t)}
является решением дифференциального уравнения
(
1
−
e
i
t
)
[
d
2
φ
d
t
2
−
(
n
+
N
p
)
d
φ
d
t
+
N
p
n
φ
]
−
N
p
n
φ
+
N
d
φ
d
t
=
0.
{\displaystyle (1-e^{it})\left[{\frac {d^{2}\varphi }{dt^{2}}}-(n+Np){\frac {d\varphi }{dt}}+Npn\varphi \right]-Npn\varphi +N{\frac {d\varphi }{dt}}=0.}
Свойства [ ]
E
ξ
=
n
p
;
{\displaystyle \mathbf {E} \xi =np;}
D
ξ
=
N
−
n
N
−
1
n
p
(
1
−
p
)
;
{\displaystyle \mathbf {D} \xi ={\frac {N-n}{N-1}}np(1-p);}
Центральные моменты 3-го и 4-го порядка:
E
(
ξ
−
E
ξ
)
3
=
(
N
−
n
)
(
N
−
2
n
)
(
N
−
1
)
(
N
−
2
)
n
p
(
1
−
p
)
(
1
−
2
p
)
;
{\displaystyle \mathbf {E} (\xi -\mathbf {E} \xi )^{3}={\frac {(N-n)(N-2n)}{(N-1)(N-2)}}np(1-p)(1-2p);}
E
(
ξ
−
E
ξ
)
4
=
n
p
(
1
−
p
)
(
N
−
n
)
(
N
−
1
)
(
N
−
2
)
(
N
−
3
)
N
(
N
+
1
)
+
6
n
(
N
−
n
)
+
3
p
(
1
−
p
)
[
n
(
N
−
n
)
(
N
+
6
)
−
2
N
2
]
;
{\displaystyle \mathbf {E} (\xi -\mathbf {E} \xi )^{4}={\frac {np(1-p)(N-n)}{(N-1)(N-2)(N-3)}}{N(N+1)+6n(N-n)+3p(1-p)[n(N-n)(N+6)-2N^{2}]};}
γ
1
=
(
1
−
2
p
)
(
N
−
2
n
)
N
−
1
n
p
(
1
−
p
)
(
N
−
n
)
(
N
−
2
)
;
{\displaystyle \gamma _{1}={\frac {(1-2p)(N-2n){\sqrt {N-1}}}{\sqrt {np(1-p)(N-n)(N-2)}}};}
γ
2
=
N
2
(
N
−
1
)
n
(
N
−
2
)
(
N
−
3
)
(
N
−
n
)
[
6
n
−
6
N
+
1
N
p
(
1
−
p
)
+
3
n
(
N
−
n
)
(
10
N
−
12
)
N
2
(
−
N
−
1
)
−
6
]
.
{\displaystyle \gamma _{2}={\frac {N^{2}(N-1)}{n(N-2)(N-3)(N-n)}}\left[{\frac {6n-6N+1}{Np(1-p)}}+{\frac {3n(N-n)(10N-12)}{N^{2}(-N-1)}}-6\right].}
Значение [ ]
Типичная схема, в которой появляется гипергеометрическое распределение: проверяется партия готовой продукции, которая содержит
N
p
{\displaystyle Np}
годных и
N
(
1
−
p
)
{\displaystyle N(1-p)}
негодных изделий. Случайным образом выбирают
n
{\displaystyle n}
изделий. Число годных изделий среди выбранных описывается гипергеометрическим распределением.
Если
n
{\displaystyle n}
мало по сравнению с
N
{\displaystyle N}
(практически, когда
n
<
0.1
N
{\displaystyle n<0.1N}
), то
C
N
p
k
C
N
(
1
−
p
)
n
−
k
C
N
n
≈
C
n
k
p
k
(
1
−
p
)
n
−
k
.
{\displaystyle {\frac {C_{Np}^{k}C_{N(1-p)}^{n-k}}{C_{N}^{n}}}\approx C_{n}^{k}p^{k}(1-p)^{n-k}.}
См.также [ ]