Negativní hypergeometrickýFunkce pravděpodobnostní hmotnosti  |
Funkce kumulativní distribuce  |
Parametry | - celkový počet prvků
- celkový počet prvků „úspěchu“
- počet poruch při zastavení experimentu |
---|
Podpěra, podpora | - počet úspěchů při zastavení experimentu. |
---|
PMF |  |
---|
Znamenat |  |
---|
Rozptyl | ![{ displaystyle r { frac {(N + 1) K} {(N-K + 1) (N-K + 2)}} [1 - { frac {r} {N-K + 1}}] }](https://wikimedia.org/api/rest_v1/media/math/render/svg/51e440acb363f2b562dbb11e50df1f9a41a68fd9) |
---|
v teorie pravděpodobnosti a statistika, negativní hypergeometrická distribuce popisuje pravděpodobnosti při vzorkování z konečné populace bez náhrady, ve které lze každý vzorek klasifikovat do dvou vzájemně se vylučujících kategorií, jako je Pass / Fail, Male / Female nebo Employed / Unemployed. Jelikož se z populace provádí náhodný výběr, každé další losování snižuje populaci, což způsobuje, že se pravděpodobnost úspěchu s každým losováním změní. Na rozdíl od standardu hypergeometrická distribuce, který popisuje počet úspěchů při pevné velikosti vzorku, při negativní hypergeometrické distribuci se vzorky kreslí do
byly nalezeny poruchy a distribuce popisuje pravděpodobnost zjištění
úspěchy v takovém vzorku. Jinými slovy, negativní hypergeometrické rozdělení popisuje pravděpodobnost
úspěchy ve vzorku s přesně
selhání.
Definice
Existují
prvky, z toho
jsou definovány jako „úspěchy“ a zbytek jsou „neúspěchy“.
Prvky se kreslí jeden po druhém, bez výměny, do
došlo k selhání. Poté se kreslení zastaví a číslo
úspěchů se počítá. Negativní hypergeometrická distribuce,
je diskrétní distribuce z toho
.
[1]
Výsledek vyžaduje pozorování
úspěchy v
kreslí a
bit musí být selhání. Pravděpodobnost první z nich lze zjistit přímou aplikací hypergeometrická distribuce
a pravděpodobnost druhé je jednoduše počet zbývajících poruch
děleno velikostí zbývající populace
. Pravděpodobnost mít přesně
úspěchy až do
selhání (tj. kreslení se zastaví, jakmile vzorek obsahuje předdefinovaný počet
selhání) je pak produktem těchto dvou pravděpodobností:

Proto a náhodná proměnná sleduje negativní hypergeometrické rozdělení, pokud je funkce pravděpodobnostní hmotnosti (pmf) je dáno

kde
je velikost populace,
je počet úspěšných států v populaci,
je počet poruch,
je počet pozorovaných úspěchů,
je binomický koeficient
Podle návrhu je pravděpodobnost součtu až 1. Avšak v případě, že to chceme explicitně ukázat, máme:

kde jsme to použili,

které lze odvodit pomocí binomická identita,
a Chu – Vandermonde identita,
, který platí pro všechny komplexní hodnoty
a
a jakékoli nezáporné celé číslo
.
Vztah
lze také zjistit zkoumáním koeficientu
v expanzi
, použitím Newtonova binomická řada.
Očekávání
Při počítání čísla
úspěchů dříve
selhání, očekávaný počet úspěchů je
a lze je odvodit následovně.
![{ displaystyle { begin {zarovnáno} E [X] & = součet _ {k = 0} ^ {K} k Pr (X = k) = součet _ {k = 0} ^ {K} k { frac {{{k + r-1} zvolit {k}} {{Nrk} zvolit {Kk}}} {N zvolit K}} = { frac {r} {N zvolit K}} vlevo [ sum _ {k = 0} ^ {K} { frac {(k + r)} {r}} {{k + r-1} zvolit {r-1}} {{Nrk} zvolit {Kk}} right] -r & = { frac {r} {N zvolte K}} doleva [ sum _ {k = 0} ^ {K} {{k + r} zvolit { r}} {{Nrk} zvolit {Kk}} doprava] -r = { frac {r} {N zvolit K}} doleva [ součet _ {k = 0} ^ {K} {{k + r} zvolit {k}} {{Nrk} zvolit {Kk}} doprava] -r & = { frac {r} {N zvolit K}} doleva [{{N + 1} zvolte K} vpravo] -r = { frac {rK} {N-K + 1}}, end {zarovnáno}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/34e659bf96fe9a5fd5828d3e0b3fe1f5c6489d00)
kde jsme použili vztah
, které jsme odvodili výše, abychom ukázali, že negativní hypergeometrická distribuce byla správně normalizována.
Rozptyl
Rozptyl lze odvodit následujícím výpočtem.
![{ displaystyle { begin {aligned} E [X ^ {2}] & = sum _ {k = 0} ^ {K} k ^ {2} Pr (X = k) = left [ sum _ {k = 0} ^ {K} (k + r) (k + r + 1) Pr (X = k) vpravo] - (2r + 1) E [X] -r ^ {2} -r & = { frac {r (r + 1)} {N zvolte K}} vlevo [ sum _ {k = 0} ^ {K} {{k + r + 1} vyberte {k + 1 }} {{N + 1- (r + 1) -k} zvolte {Kk}} doprava] - (2r + 1) E [X] -r ^ {2} -r & = { frac {r (r + 1)} {N zvolte K}} vlevo [{{N + 2} vyberte K} vpravo] - (2r + 1) E [X] -r ^ {2} -r = { frac {rK (N-r + Kr + 1)} {(N-K + 1) (N-K + 2)}} end {zarovnáno}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6b47c46822d0efeff017d9a23630514c05a4d4d6)
Pak je rozptyl ![{ displaystyle { textrm {Var}} [X] = E [X ^ {2}] - vlevo (E [X] vpravo) ^ {2} = { frac {rK (N + 1) (NK -r + 1)} {(N-K + 1) ^ {2} (N-K + 2)}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ec84a94aaf05ac30602871150e31225388300cf9)
Související distribuce
Pokud se kresba zastaví po konstantním počtu
remíz (bez ohledu na počet neúspěchů), pak počet úspěchů má hypergeometrická distribuce,
. Tyto dvě funkce souvisí následujícím způsobem:[1]

Negativní hypergeometrická distribuce (jako hypergeometrická distribuce) se zabývá remízami bez výměny, takže pravděpodobnost úspěchu je v každém losování odlišná. Naproti tomu negativní binomické rozdělení (jako binomické rozdělení) se zabývá remízami s výměnou, takže pravděpodobnost úspěchu je stejná a zkoušky jsou nezávislé. Následující tabulka shrnuje čtyři distribuce související s položkami výkresu:
Reference
|
---|
Diskrétní univariate s konečnou podporou | |
---|
Diskrétní univariate s nekonečnou podporou | |
---|
Kontinuální univariate podporováno v omezeném intervalu | |
---|
Kontinuální univariate podporováno v poloneomezeném intervalu | |
---|
Kontinuální univariate podporováno na celé reálné linii | |
---|
Kontinuální univariate s podporou, jejíž typ se liší | |
---|
Smíšený spojitý-diskrétní univariate | |
---|
Vícerozměrný (společný) | |
---|
Směrový | |
---|
Degenerovat a jednotné číslo | |
---|
Rodiny | |
---|