Poissonovo rozdělení - Poisson distribution
Funkce pravděpodobnostní hmotnosti ![]() Vodorovná osa je index k, počet výskytů. λ je očekávaná míra výskytu. Svislá osa je pravděpodobnost k dané události λ. Funkce je definována pouze při celočíselných hodnotách k; spojovací čáry jsou pouze vodítky pro oko. | |||
Funkce kumulativní distribuce ![]() Vodorovná osa je index k, počet výskytů. CDF je diskontinuální v celých číslech k a plochý všude jinde, protože proměnná, která je distribuována Poissonem, přebírá pouze celočíselné hodnoty. | |||
Zápis | |||
---|---|---|---|
Parametry | (hodnotit) | ||
Podpěra, podpora | (Přirozená čísla od 0) | ||
PMF | |||
CDF | nebo nebo (pro , kde je horní neúplná funkce gama, je funkce podlahy a Q je regularizovaná funkce gama ) | ||
Znamenat | |||
Medián | |||
Režim | |||
Rozptyl | |||
Šikmost | |||
Př. špičatost | |||
Entropie | (pro velké ) | ||
MGF | |||
CF | |||
PGF | |||
Fisher informace |
v teorie pravděpodobnosti a statistika, Poissonovo rozdělení (/ˈpwɑːsɒn/; Francouzská výslovnost:[pwasɔ̃]), pojmenoval podle francouzština matematik Siméon Denis Poisson, je diskrétní rozdělení pravděpodobnosti který vyjadřuje pravděpodobnost daného počtu událostí vyskytujících se v pevném časovém nebo prostorovém intervalu, pokud k těmto událostem dojde se známou konstantní střední rychlostí a nezávisle času od poslední události.[1] Poissonovo rozdělení lze také použít pro počet událostí v jiných určených intervalech, jako je vzdálenost, plocha nebo objem.
Například jednotlivec, který sleduje množství pošty, které dostává každý den, si může všimnout, že dostává průměrný počet 4 dopisů denně. Pokud příjem konkrétní poštovní zásilky nemá vliv na časy příchodu budoucích poštovních zásilek, tj. Pokud poštovní zásilky ze široké škály zdrojů dorazí nezávisle na sobě, pak lze rozumně předpokládat, že počet přijatých poštovních zásilek za den se řídí Poissonovým rozdělením.[2] Mezi další příklady, které mohou následovat Poissonovu distribuci, patří počet telefonních hovorů přijatých call centrem za hodinu a počet událostí rozpadu za sekundu z radioaktivního zdroje.
Definice
Funkce pravděpodobnostní hmotnosti
Poissonova distribuce je populární pro modelování kolikrát dojde k události v časovém nebo prostorovém intervalu.
Diskrétní náhodná proměnná X se říká, že má Poissonovo rozdělení s parametrem λ > 0, pokud pro k = 0, 1, 2, ..., funkce pravděpodobnostní hmotnosti z X je dána:[3]:60
kde
- E je Eulerovo číslo (E = 2.71828...)
- k je počet výskytů
- k! je faktoriál z k.
Pozitivní reálné číslo λ se rovná očekávaná hodnota z X a také k jeho rozptyl[4]
Poissonovo rozdělení lze aplikovat na systémy s a velké množství možných událostí, z nichž každá je vzácná. Počet takových událostí, ke kterým dojde během pevného časového intervalu, je za správných okolností náhodné číslo s Poissonovým rozdělením.
Rovnici lze upravit, pokud namísto průměrného počtu událostí , dostaneme časovou sazbu pro počet událostí stát se. Pak (zobrazeno počet událostí za jednotku času) a
Příklad
Poissonovo rozdělení může být užitečné pro modelování událostí jako např
- Počet meteoritů o průměru větším než 1 metr, které zasáhnou Zemi za rok
- Počet pacientů přijíždějících na pohotovost mezi 22 a 23 hodinou
- Počet laserových fotonů dopadajících na detektor v určitém časovém intervalu
Předpoklady a platnost
Poissonovo rozdělení je vhodný model, pokud jsou splněny následující předpoklady:[5]
- k je počet výskytů události v intervalu a k může nabývat hodnot 0, 1, 2, ....
- Výskyt jedné události nemá vliv na pravděpodobnost, že dojde k druhé události. To znamená, že k událostem dochází nezávisle.
- Průměrná rychlost výskytu událostí je nezávislá na jakýchkoli událostech. Pro zjednodušení se to obvykle předpokládá konstantní, ale v praxi se to může časem lišit.
- Dvě události nemohou nastat přesně ve stejném okamžiku; místo toho v každém velmi malém dílčím intervalu nastane nebo nenastane přesně jedna událost.
Pokud jsou tyto podmínky pravdivé, pak k je Poissonova náhodná proměnná a rozdělení k je Poissonovo rozdělení.
Poissonovo rozdělení je také omezit a binomická distribuce, pro které se pravděpodobnost úspěchu u každého pokusu rovná λ děleno počtem pokusů, protože počet pokusů se blíží nekonečnu (viz Související distribuce ).
Příklady pravděpodobnosti Poissonova rozdělení
Na konkrétní řece se přepadové povodně vyskytují v průměru jednou za 100 let. Vypočítejte pravděpodobnost k = 0, 1, 2, 3, 4, 5 nebo 6 přepadových povodní ve 100letém intervalu za předpokladu, že je vhodný Poissonův model. Protože průměrná míra událostí je jedna přetečení za 100 let, λ = 1
| Níže uvedená tabulka uvádí pravděpodobnost 0 až 6 přepadových povodní za období 100 let.
|
Ugarte a kolegové uvádějí, že průměrný počet gólů ve fotbalovém zápase mistrovství světa je přibližně 2,5 a Poissonův model je vhodný.[6]Protože průměrná míra událostí je 2,5 gólu na zápas, λ = 2.5.
| Tabulka níže uvádí pravděpodobnost 0 až 7 gólů v zápase.
|
Události v intervalu: Zvláštní případ λ = 1 a k = 0
Předpokládejme, že astronomové odhadují, že velké meteority (nad určitou velikost) zasáhly Zemi v průměru jednou za 100 let (λ = 1 událost za 100 let) a že počet zásahů meteoritů sleduje Poissonovo rozdělení. Jaká je pravděpodobnost k = 0 zásahů meteoritu v příštích 100 letech?
Za těchto předpokladů je pravděpodobnost, že v příštích 100 letech nenarazí na Zemi žádné velké meteority, zhruba 0,37. Zbývajících 1 - 0,37 = 0,63 je pravděpodobnost 1, 2, 3 nebo více zásahů velkých meteoritů v příštích 100 letech. Ve výše uvedeném příkladu došlo k přetečení jednou za 100 let (λ = 1). Podle stejného výpočtu byla pravděpodobnost záplavy za 100 let zhruba 0,37.
Obecně platí, že pokud k události dojde v průměru jednou za interval (λ = 1) a události následují Poissonovo rozdělení P(0 událostí v dalším intervalu) = 0,37. Navíc, P(přesně jedna událost v dalším intervalu) = 0,37, jak je uvedeno v tabulce pro přetečení povodní.
Příklady, které porušují Poissonovy předpoklady
Počet studentů, kteří přijedou na studentská unie za minutu pravděpodobně nebude následovat Poissonovo rozdělení, protože rychlost není konstantní (nízká rychlost během vyučování, vysoká rychlost mezi vyučovacími hodinami) a příjezdy jednotlivých studentů nejsou nezávislé (studenti mají tendenci přicházet ve skupinách).
Počet zemětřesení o velikosti 5 za rok v zemi nemusí následovat Poissonovo rozdělení, pokud jedno velké zemětřesení zvyšuje pravděpodobnost následných otřesů podobné velikosti.
Příklady, ve kterých je zaručena alespoň jedna událost, nejsou distribuovány Poission; ale lze modelovat pomocí a Nulové zkrácené Poissonovo rozdělení.
Distribuce počtu, ve kterých je počet intervalů s nulovými událostmi vyšší, než předpovídal Poissonův model, lze modelovat pomocí a Model s nulovým nafouknutím.
Vlastnosti
Deskriptivní statistika
- The očekávaná hodnota a rozptyl Poissonově distribuované náhodné proměnné jsou obě rovny λ.
- The variační koeficient je , zatímco index disperze je 1.[7]:163
- The znamená absolutní odchylku o průměru je[7]:163
- The režimu Poissonově distribuované náhodné proměnné s neceločíselným λ se rovná , což je největší celé číslo menší nebo rovnoλ. Toto se také píše jako podlaha (λ). Když λ je kladné celé číslo, režimy jsou λ a λ − 1.
- Všechny kumulanty Poissonova rozdělení se rovnají očekávané hodnotěλ. The nth faktoriální moment Poissonova rozdělení je λn.
- The očekávaná hodnota a Poissonův proces se někdy rozkládá na produkt intenzita a vystavení (nebo obecněji vyjádřeno jako integrál „funkce intenzity“ v čase nebo prostoru, někdy označované jako „expozice“).[8]
Medián
Meze pro medián () distribuce jsou známy a jsou ostrý:[9]
Vyšší okamžiky
- Ten vyšší momenty mk Poissonova rozdělení o původu jsou Dotykové polynomy v λ:
- kde {složené závorky} označují Stirlingova čísla druhého druhu.[10][1]:6 Koeficienty polynomů mají a kombinační význam. Ve skutečnosti, když je očekávaná hodnota Poissonova rozdělení 1, pak Dobinského vzorec říká, že nten okamžik se rovná počtu oddíly sady velikosti n.
Pro necentrované momenty definujeme , pak[11]
kde je nějaká absolutní konstanta větší než 0.
Součty Poissonově distribuovaných náhodných proměnných
- Li pro jsou nezávislý, pak .[12]:65 Konverzace je Raikovova věta, který říká, že pokud je součet dvou nezávislých náhodných proměnných distribuován podle Poissona, pak platí i každá z těchto dvou nezávislých náhodných proměnných.[13][14]
Další vlastnosti
- Poissonovo rozdělení je nekonečně dělitelný rozdělení pravděpodobnosti.[15]:233[7]:164
- Režie Kullback – Leiblerova divergence z z je dána
- Hranice pravděpodobností ocasu Poissonovy náhodné proměnné lze odvodit pomocí a Černoff svázán argument.[16]:97-98
- ,
- Pravděpodobnost horního ocasu lze utáhnout (nejméně dvakrát) takto:[17]
- kde je směrovaná Kullback – Leiblerova divergence, jak je popsáno výše.
- Nerovnosti, které se vztahují k distribuční funkci Poissonovy náhodné proměnné do Standardní normální rozdělení funkce jsou následující:[17]
- kde je opět řízená Kullback – Leiblerova divergence.
Poissonovy závody
Nechat a být nezávislé náhodné proměnné, s , pak tu máme
Horní mez je prokázána pomocí standardní Chernoffovy meze.
Dolní mez lze prokázat tím, že si to všimneme je pravděpodobnost, že , kde , který je níže ohraničen , kde je relativní entropie (Viz záznam na hranice na ocasy binomických distribucí pro detaily). Dále si to všímat a výpočet dolní meze bezpodmínečné pravděpodobnosti dává výsledek. Více podrobností naleznete v příloze Kamath et al..[18]
Související distribuce
Všeobecné
- Li a jsou nezávislé, pak rozdíl následuje a Distribuce Skellam.
- Li a jsou nezávislé, pak distribuce podmíněno je binomická distribuce.
- Konkrétně pokud , pak .
- Obecněji, pokud X1, X2,..., Xn jsou nezávislé Poissonovo náhodné proměnné s parametry λ1, λ2,..., λn pak
- daný . Ve skutečnosti, .
- Li a distribuce , podmíněno X = k, je binomická distribuce, , potom rozdělení Y následuje Poissonovo rozdělení . Ve skutečnosti, pokud , podmíněné X = k, sleduje multinomické rozdělení, , pak každý následuje nezávislé Poissonovo rozdělení .
- Poissonovo rozdělení lze odvodit jako omezující případ na binomické rozdělení, protože počet pokusů jde do nekonečna a očekávaný počet úspěchů zůstává pevný - viz zákon vzácných událostí níže. Proto jej lze použít jako aproximaci binomického rozdělení, pokud n je dostatečně velký a p je dostatečně malý. Existuje obecné pravidlo, že Poissonovo rozdělení je dobrou aproximací binomického rozdělení, pokud n je alespoň 20 a p je menší nebo roven 0,05 a vynikající aproximace, pokud n ≥ 100 a np ≤ 10.[19]
- Poissonovo rozdělení je a speciální případ diskrétní složené Poissonovy distribuce (nebo koktání Poissonovy distribuce) pouze s parametrem.[20][21] Diskrétní složené Poissonovo rozdělení lze odvodit z omezujícího rozdělení jednorozměrného multinomického rozdělení. Je to také a speciální případ a složené Poissonovo rozdělení.
- Pro dostatečně velké hodnoty λ (řekněme λ> 1000) platí normální distribuce se střední hodnotou λ a rozptylem λ (směrodatná odchylka ) je vynikající aproximací Poissonova rozdělení. Pokud je λ větší než asi 10, pak je normální rozdělení, je-li to vhodné, dobrá aproximace korekce spojitosti se provádí, tj. pokud P (X ≤ X), kde X je nezáporné celé číslo, je nahrazeno P (X ≤ X + 0.5).
- Varianta stabilizující odchylku: Pokud , pak
- ,[7]:168
- a
- .[22]:196
- V rámci této transformace konvergence k normálnosti (jako zvýšení) je mnohem rychlejší než netransformovaná proměnná.[Citace je zapotřebí ] K dispozici jsou další, trochu komplikovanější transformace stabilizující rozptyl,[7]:168 jedním z nich je Anscombeova transformace.[23] Vidět Transformace dat (statistika) pro obecnější použití transformací.
- Pokud pro každého t > 0 počet příjezdů v časovém intervalu [0,t] sleduje Poissonovo rozdělení s průměrem λt, pak jsou sekvence časů mezi příchody nezávislé a identicky distribuované exponenciální náhodné proměnné mající průměr 1 /λ.[24]:317–319
- The kumulativní distribuční funkce Poissona a chi-kvadrát distribuce jsou spojeny následujícími způsoby:[7]:167
- a[7]:158
Poissonova aproximace
Převzít kde , pak[25] je multinomically distribuovány podmíněno .
To znamená[16]:101-102, mimo jiné pro jakoukoli nezápornou funkci ,li je tedy multinomálně distribuován
kde .
Faktor lze odstranit, pokud dále se předpokládá, že se monotónně zvyšuje nebo snižuje.
Bivariate Poissonovo rozdělení
Tato distribuce byla rozšířena na bivariate případ.[26] The generující funkce pro tuto distribuci je
s
Okrajové distribuce jsou Poissonovy (θ1) a Poisson (θ2) a korelační koeficient je omezen na rozsah
Jednoduchý způsob, jak generovat dvojrozměrné Poissonovo rozdělení je vzít tři nezávislé Poissonovy distribuce s prostředky a poté nastavit . Pravděpodobnostní funkce bivariačního Poissonova rozdělení je
Zdarma Poissonova distribuce
Zdarma Poissonova distribuce[27] s velikostí skoku a hodnotit vzniká v bezplatná pravděpodobnost teorie jako hranice opakování bezplatná konvoluce
tak jako N → ∞.
Jinými slovy, pojďme být náhodné proměnné, takže má hodnotu s pravděpodobností a hodnota 0 se zbývající pravděpodobností. Předpokládejme také, že rodina jsou svobodně nezávislý. Pak limit jako zákona je dán zákonem Free Poisson s parametry .
Tato definice je analogická jednomu ze způsobů, jakým se klasická Poissonova distribuce získává z (klasického) Poissonova procesu.
Míra spojená s volným Poissonovým zákonem je dána vztahem[28]
kde
a má podporu .
Tento zákon také vzniká v náhodná matice teorie jako Marchenko – Pasturovo právo. Své zdarma kumulanty jsou rovny .
Některé transformace tohoto zákona
Uvádíme hodnoty některých důležitých transformací volného Poissonova zákona; výpočet lze najít např. v knize Přednášky o kombinatorice volné pravděpodobnosti A. Nica a R. Speicher[29]
The R-transformace volného Poissonova zákona je dán vztahem
The Cauchyova transformace (což je zápor z Stieltjesova transformace ) darováno
The S-transformace je dána
v případě, že .
Statistická inference
Odhad parametrů
Vzhledem k vzorku n naměřené hodnoty , pro i = 1, ..., n, chceme odhadnout hodnotu parametru λ populace Poissona, ze kterého byl vzorek odebrán. The maximální pravděpodobnost odhad je [30]
Protože každé pozorování má očekávání λ, znamená to i vzorek. Maximální odhad pravděpodobnosti je proto nezaujatý odhad λ. Je to také efektivní odhad, protože jeho rozptyl dosahuje Cramér – Rao dolní mez (CRLB).[Citace je zapotřebí ] Proto je minimální rozptyl nestranný. Rovněž lze dokázat, že součet (a tedy průměr vzorku, protože se jedná o individuální funkci součtu), je úplnou a dostatečnou statistikou pro λ.
Abychom prokázali dostatečnost, můžeme použít faktorizační věta. Zvažte rozdělení funkce pravděpodobnostní hmotnosti společného Poissonova rozdělení pro vzorek na dvě části: jednu, která závisí výhradně na vzorku (volala ) a ten, který závisí na parametru a vzorek pouze prostřednictvím funkce . Pak je dostatečná statistika pro .
První termín, , záleží jen na . Druhý termín, , záleží na vzorku pouze prostřednictvím . Tím pádem, je dostačující.
Abychom našli parametr λ, který maximalizuje pravděpodobnostní funkci pro Poissonovu populaci, můžeme použít logaritmus funkce pravděpodobnosti:
Bereme derivaci s ohledem na λ a porovnat to s nulou:
Řešení pro λ dává stacionární bod.
Tak λ je průměr z ki hodnoty. Získání znaménka druhé derivace L ve stacionárním bodě určí, jaký druh extrémní hodnoty λ je.
Hodnocení druhé derivace ve stacionárním bodě dává:
což je zápor n krát převrácená hodnota průměru ki. Tento výraz je negativní, když je průměr kladný. Pokud je to splněno, pak stacionární bod maximalizuje pravděpodobnostní funkci.
Pro úplnost, se říká, že rodina distribucí je úplná právě tehdy to naznačuje pro všechny . Pokud jednotlivec jsou iid , pak . Znát distribuci, kterou chceme prozkoumat, je snadné vidět, že statistika je úplná.
Aby tato rovnost platila, musí být 0. To vyplývá ze skutečnosti, že žádný z ostatních výrazů nebude 0 pro všechny v součtu a pro všechny možné hodnoty . Proto, pro všechny to naznačuje a statistika se ukázala jako úplná.
Interval spolehlivosti
The interval spolehlivosti protože průměr Poissonova rozdělení lze vyjádřit pomocí vztahu mezi kumulativními distribučními funkcemi Poissonova a chi-kvadrát distribuce. Samotná distribuce chí-kvadrát úzce souvisí s gama distribuce, a to vede k alternativnímu výrazu. Vzhledem k pozorování k z Poissonova rozdělení se střední hodnotou μ, interval spolehlivosti pro μ s úrovní spolehlivosti 1 - α je
nebo ekvivalentně
kde je kvantilová funkce (odpovídá spodní ocasní ploše p) distribuce chí-kvadrát s n stupně volnosti a je kvantilová funkce a gama distribuce s parametrem tvaru n a parametrem měřítka 1.[7]:176-178[31] Tento interval jepřesný „v tom smyslu, že jeho pravděpodobnost pokrytí nikdy není menší než nominální 1 - α.
Pokud kvantily distribuce gama nejsou k dispozici, byla navržena přesná aproximace tohoto přesného intervalu (na základě Wilsonova-Hilfertyova transformace ):[32]
kde označuje standardní normální odchylka s horní ocasní plochou α / 2.
Pro použití těchto vzorců ve stejném kontextu jako výše (uveden vzorek n naměřené hodnoty ki každý čerpán z Poissonova rozdělení se střední hodnotou λ), jeden by nastavil
vypočítat interval pro μ = nλ, a poté odvodit interval pro λ.
Bayesovský závěr
v Bayesovský závěr, před konjugátem pro parametr sazby λ Poissonova rozdělení je gama distribuce.[33] Nechat
naznačit to λ je distribuován podle gama hustota G parametrizováno pomocí a parametr tvaru α a inverzní parametr měřítka β:
Poté, vzhledem ke stejnému vzorku n naměřené hodnoty ki jako dříve a před gama (α, β), zadní distribuce je
Zadní průměr E [λ] se blíží odhadu maximální věrohodnosti v limitu jako , který bezprostředně vyplývá z obecného vyjádření průměru gama distribuce.
The zadní prediktivní distribuce pro jediné další pozorování je a negativní binomické rozdělení,[34]:53 někdy nazývané gama – Poissonovo rozdělení.
Simultánní odhad více Poissonových prostředků
Předpokládat je sada nezávislých náhodných proměnných ze sady Poissonovo rozdělení, každé s parametrem , , a chtěli bychom tyto parametry odhadnout. Poté Clevenson a Zidek ukazují, že za normalizované čtvercové ztráty chyb , když , podobně jako v Steinův příklad pro normální znamená odhad MLE je nepřípustný. [35]
V tomto případě rodina odhady minimaxu je uveden pro všechny a tak jako[36]
Výskyt a aplikace
![]() | tento článek potřebuje další citace pro ověření.Prosince 2019) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Aplikace Poissonovy distribuce lze nalézt v mnoha oblastech, včetně:[37]
- Telekomunikace příklad: telefonní hovory přicházející do systému.
- Astronomie příklad: fotony přicházející k dalekohledu.
- Chemie příklad: distribuce molární hmotnosti a živá polymerace.[38]
- Biologie příklad: počet mutací na řetězci DNA na jednotku délky.
- Řízení příklad: zákazníci přijíždějící k přepážce nebo call centru.
- Finance a pojištění příklad: počet ztrát nebo škod vzniklých v daném časovém období.
- Zemětřesení seismologie příklad: asymptotický Poissonův model seismického rizika pro velká zemětřesení.[39]
- Radioaktivita příklad: počet rozpadů v daném časovém intervalu v radioaktivním vzorku.
- Optika příklad: počet fotonů emitovaných v jednom laserovém pulsu. To je hlavní zranitelnost pro většinu Kvantová distribuce klíčů protokoly známé jako rozdělení fotonových čísel (PNS).
Poissonovo rozdělení vzniká v souvislosti s Poissonovými procesy. Vztahuje se na různé jevy diskrétních vlastností (tj. Ty, které se mohou stát 0, 1, 2, 3, ... krát během daného časového období nebo v dané oblasti), kdykoli je pravděpodobnost, že se jev stane, konstantní čas nebo prostor. Mezi příklady událostí, které lze modelovat jako Poissonovo rozdělení, patří:
- Počet vojáků zabitých koňskými kopy každý rok v každém sboru v pruský kavalerie. Tento příklad použil v knize autor Ladislava Bortkiewicze (1868–1931).[40]:23-25
- Počet kvasinkových buněk použitých při vaření Guinness pivo. Tento příklad použil William Sealy Gosset (1876–1937).[41][42]
- Počet příchozích telefonních hovorů na a call centrum do minuty. Tento příklad popsal A.K. Erlang (1878–1929).[43]
- Internetový provoz.
- Počet branek ve sportu zahrnujících dva konkurenční týmy.[44]
- Počet úmrtí za rok v dané věkové skupině.
- Počet skoků v ceně akcií v daném časovém intervalu.
- Za předpokladu stejnorodost, kolikrát a webový server je přístupné za minutu.
- Počet mutace v daném úseku DNA po určitém množství záření.
- Podíl buňky které budou v danou chvíli infikovány mnohočetnost infekce.
- Počet bakterií v určitém množství kapaliny.[45]
- Příchod fotony na obvodu pixelu při daném osvětlení a za dané časové období.
- Cílení na V-1 létající bomby o Londýně během druhé světové války vyšetřován R. D. Clarkem v roce 1946.[46]
Gallagher v roce 1976 ukázal, že počty prvočísla v krátkých intervalech dodržujte Poissonovo rozdělení[47] poskytl určitou verzi nepotvrzeného hlavní domněnka r-n-tice Hardy-Littlewood[48] je pravda.
Zákon vzácných událostí

Rychlost události souvisí s pravděpodobností události, ke které dojde v nějakém malém podintervalu (času, prostoru nebo jinak). V případě Poissonova rozdělení se předpokládá, že existuje dostatečně malý subinterval, pro který je pravděpodobnost dvakrát se vyskytující události „zanedbatelná“. S tímto předpokladem lze odvodit Poissonovo rozdělení z binomického, pouze za předpokladu informace o očekávaném počtu celkových událostí v celém intervalu. Nechť je tento celkový počet . Rozdělte celý interval na podintervaly stejné velikosti, takové, že > (protože nás zajímá jen velmi malá část intervalu, je tento předpoklad smysluplný). To znamená, že očekávaný počet událostí v intervalu pro každého je rovný . Nyní předpokládáme, že na výskyt události v celém intervalu lze pohlížet jako na Bernoulliho soud, Kde pokus odpovídá pohledu, zda k události dojde v podintervalu s pravděpodobností . Očekávaný počet celkových událostí v roce takové zkoušky by byly , očekávaný počet celkových událostí v celém intervalu. Hence for each subdivision of the interval we have approximated the occurrence of the event as a Bernoulli process of the form . As we have noted before we want to consider only very small subintervals. Therefore, we take the limit as goes to infinity.In this case the binomial distribution converges to what is known as the Poisson distribution by the Poisson limit theorem.
In several of the above examples—such as, the number of mutations in a given sequence of DNA—the events being counted are actually the outcomes of discrete trials, and would more precisely be modelled using the binomická distribuce, to je
In such cases n is very large and p is very small (and so the expectation np is of intermediate magnitude). Then the distribution may be approximated by the less cumbersome Poisson distribution[Citace je zapotřebí ]
This approximation is sometimes known as the law of rare events,[49]:5since each of the n individuální Bernoulli events rarely occurs. The name may be misleading because the total count of success events in a Poisson process need not be rare if the parameter np is not small. For example, the number of telephone calls to a busy switchboard in one hour follows a Poisson distribution with the events appearing frequent to the operator, but they are rare from the point of view of the average member of the population who is very unlikely to make a call to that switchboard in that hour.
Slovo zákon se někdy používá jako synonymum rozdělení pravděpodobnosti, a convergence in law prostředek convergence in distribution. Accordingly, the Poisson distribution is sometimes called the "law of small numbers" because it is the probability distribution of the number of occurrences of an event that happens rarely but has very many opportunities to happen. The Law of Small Numbers is a book by Ladislaus Bortkiewicz about the Poisson distribution, published in 1898.[40][50]
Proces Poissonova bodu
The Poisson distribution arises as the number of points of a Proces Poissonova bodu located in some finite region. Přesněji řečeno, pokud D is some region space, for example Euclidean space Rd, for which |D|, the area, volume or, more generally, the Lebesgue measure of the region is finite, and if N(D) denotes the number of points in D, pak
Poisson regression and negative binomial regression
Poissonova regrese and negative binomial regression are useful for analyses where the dependent (response) variable is the count (0, 1, 2, ...) of the number of events or occurrences in an interval.
Other applications in science
In a Poisson process, the number of observed occurrences fluctuates about its mean λ s standardní odchylka . These fluctuations are denoted as Poissonův hluk or (particularly in electronics) as hluk výstřelu.
The correlation of the mean and standard deviation in counting independent discrete occurrences is useful scientifically. By monitoring how the fluctuations vary with the mean signal, one can estimate the contribution of a single occurrence, even if that contribution is too small to be detected directly. For example, the charge E on an electron can be estimated by correlating the magnitude of an elektrický proud s jeho hluk výstřelu. Li N electrons pass a point in a given time t on the average, the znamenat proud je ; since the current fluctuations should be of the order (i.e., the standard deviation of the Poissonův proces ), the charge can be estimated from the ratio .[Citace je zapotřebí ]
An everyday example is the graininess that appears as photographs are enlarged; the graininess is due to Poisson fluctuations in the number of reduced stříbrný grains, not to the individual grains themselves. Podle correlating the graininess with the degree of enlargement, one can estimate the contribution of an individual grain (which is otherwise too small to be seen unaided).[Citace je zapotřebí ] Many other molecular applications of Poisson noise have been developed, e.g., estimating the number density of receptor molecules in a buněčná membrána.
v Causal Set theory the discrete elements of spacetime follow a Poisson distribution in the volume.
Výpočtové metody
The Poisson distribution poses two different tasks for dedicated software libraries: Evaluating distribuce , a drawing random numbers according to that distribution.
Evaluating the Poisson distribution
Výpočetní za dané a is a trivial task that can be accomplished by using the standard definition of in terms of exponential, power, and factorial functions. However, the conventional definition of the Poisson distribution contains two terms that can easily overflow on computers: λk a k!. The fraction of λk na k! can also produce a rounding error that is very large compared to E−λ, and therefore give an erroneous result. For numerical stability the Poisson probability mass function should therefore be evaluated as
which is mathematically equivalent but numerically stable. The natural logarithm of the Funkce gama can be obtained using the lgamma
funkce v C standard library (C99 version) or R, gammaln
funkce v MATLAB nebo SciPy, nebo log_gamma
funkce v Fortran 2008 and later.
Some computing languages provide built-in functions to evaluate the Poisson distribution, namely
- R: function
dpois(x, lambda)
; - Vynikat: function
POISSON( x, mean, cumulative)
, with a flag to specify the cumulative distribution; - Mathematica: univariate Poisson distribution as
PoissonDistribution[]
,[51] bivariate Poisson distribution asMultivariatePoissonDistribution[,{ , }]
,.[52]
Random drawing from the Poisson distribution
The less trivial task is to draw random integers from the Poisson distribution with given .
Solutions are provided by:
- R: function
rpois(n, lambda)
; - Vědecká knihovna GNU (GSL): function gsl_ran_poisson
Generating Poisson-distributed random variables
A simple algorithm to generate random Poisson-distributed numbers (vzorkování pseudonáhodných čísel ) has been given by Knuth:[53]:137-138
algoritmus poisson random number (Knuth): inic: Nechat L ← E−λ, k ← 0 and p ← 1. dělat: k ← k + 1. Generate uniform random number u in [0,1] and nechat p ← p × u. zatímco p > L. vrátit se k − 1.
The complexity is linear in the returned value k, which is λ on average. There are many other algorithms to improve this. Some are given in Ahrens & Dieter, see § References níže.
For large values of λ, the value of L = E−λ may be so small that it is hard to represent. This can be solved by a change to the algorithm which uses an additional parameter STEP such that E−STEP does not underflow:[Citace je zapotřebí ]
algoritmus poisson random number (Junhao, based on Knuth): inic: Nechat λLeft ← λ, k ← 0 and p ← 1. dělat: k ← k + 1. Generate uniform random number u in (0,1) and nechat p ← p × u. zatímco p < 1 and λLeft > 0: -li λLeft > STEP: p ← p × EKROK λLeft ← λLeft − STEP jiný: p ← p × EλLeft λLeft ← 0 zatímco p > 1. vrátit se k − 1.
The choice of STEP depends on the threshold of overflow. For double precision floating point format, the threshold is near E700, so 500 shall be a safe KROK.
Other solutions for large values of λ include odmítnutí vzorkování and using Gaussian approximation.
Vzorkování inverzní transformace is simple and efficient for small values of λ, and requires only one uniform random number u na vzorek. Cumulative probabilities are examined in turn until one exceeds u.
algoritmus Poisson generator based upon the inversion by sequential search:[54]:505 inic: Nechat x ← 0, p ← E−λ, s ← p. Generate uniform random number u in [0,1]. zatímco u > s dělat: x ← x + 1. p ← p × λ / x. s ← s + p. vrátit se X.
Dějiny
The distribution was first introduced by Siméon Denis Poisson (1781–1840) and published together with his probability theory in his work Recherches sur la probabilité des jugements en matière criminelle et en matière civile(1837).[55]:205-207 The work theorized about the number of wrongful convictions in a given country by focusing on certain náhodné proměnné N that count, among other things, the number of discrete occurrences (sometimes called "events" or "arrivals") that take place during a čas -interval of given length. The result had already been given in 1711 by Abraham de Moivre v De Mensura Sortis seu; de Probabilitate Eventuum in Ludis a Casu Fortuito Pendentibus .[56]:219[57]:14-15[58]:193[7]:157 This makes it an example of Stiglerův zákon and it has prompted some authors to argue that the Poisson distribution should bear the name of de Moivre.[59][60]
V roce 1860 Simon Newcomb fitted the Poisson distribution to the number of stars found in a unit of space.[61]A further practical application of this distribution was made by Ladislava Bortkiewicze in 1898 when he was given the task of investigating the number of soldiers in the Prussian army killed accidentally by horse kicks;[40]:23-25 this experiment introduced the Poisson distribution to the field of spolehlivostní inženýrství.
Viz také
- Složené Poissonovo rozdělení
- Conway – Maxwell – Poissonovo rozdělení
- Erlang distribuce
- Hermitova distribuce
- Index disperze
- Negativní binomické rozdělení
- Poisson clumping
- Proces Poissonova bodu
- Poissonova regrese
- Poisson sampling
- Poisson wavelet
- Teorie řazení
- Teorie obnovy
- Robbins lemma
- Distribuce Skellam
- Tweedie distribuce
- Model s nulovým nafouknutím
- Nulové zkrácené Poissonovo rozdělení
Reference
Citace
- ^ A b Haight, Frank A. (1967), Handbook of the Poisson Distribution, New York, NY, USA: John Wiley & Sons, ISBN 978-0-471-33932-8
- ^ Brooks, E. Bruce (2007-08-24), Statistiky | The Poisson Distribution, Warring States Project, Umass.edu, vyvoláno 2014-04-18
- ^ Yates, Roy D.; Goodman, David J. (2014), Probability and Stochastic Processes: A Friendly Introduction for Electrical and Computer Engineers (2nd ed.), Hoboken, USA: Wiley, ISBN 978-0-471-45259-1
- ^ For the proof, see :Proof wiki: expectation a Proof wiki: variance
- ^ Koehrsen, William (2019-01-20), The Poisson Distribution and Poisson Process Explained, Towards Data Science, vyvoláno 2019-09-19
- ^ Ugarte, Maria Dolores; Militino, Ana F.; Arnholt, Alan T. (2016), Probability and Statistics with R (Second ed.), Boca Raton, FL, USA: CRC Press, ISBN 978-1-4665-0439-4
- ^ A b C d E F G h i Johnson, Norman L .; Kemp, Adrienne W.; Kotz, Samuel (2005), "Poisson Distribution", Jednorozměrné diskrétní distribuce (3rd ed.), New York, NY, USA: John Wiley & Sons, Inc., pp. 156–207, doi:10.1002/0471715816, ISBN 978-0-471-27246-5
- ^ Helske, Jouni (2017). "KFAS: Exponential family state space models in R". arXiv:1612.01907 [stat.CO ].
- ^ Choi, Kwok P. (1994), "On the medians of gamma distributions and an equation of Ramanujan", Proceedings of the American Mathematical Society, 121 (1): 245–251, doi:10.2307/2160389, JSTOR 2160389
- ^ Riordan, John (1937), "Moment Recurrence Relations for Binomial, Poisson and Hypergeometric Frequency Distributions" (PDF), Annals of Mathematical Statistics, 8 (2): 103–111, doi:10.1214/aoms/1177732430, JSTOR 2957598
- ^ Jagadeesan, Meena (2017). "Simple analysis of sparse, sign-consistent JL". arXiv:1708.02966 [cs.DS ].
- ^ Lehmann, Erich Leo (1986), Testing Statistical Hypotheses (second ed.), New York, NJ, USA: Springer Verlag, ISBN 978-0-387-94919-2
- ^ Raikov, Dmitry (1937), "On the decomposition of Poisson laws", Comptes Rendus de l'Académie des Sciences de l'URSS, 14: 9–11
- ^ von Mises, Richard (1964), Mathematical Theory of Probability and Statistics, New York, NJ, USA: Academic Press, doi:10.1016/C2013-0-12460-9, ISBN 978-1-4832-3213-3
- ^ Laha, Radha G.; Rohatgi, Vijay K. (1979), Teorie pravděpodobnosti, New York, NJ, USA: John Wiley & Sons, ISBN 978-0-471-03262-5
- ^ A b Mitzenmacher, Michael; Upfal, Eli (2005), Pravděpodobnost a výpočet: Randomizované algoritmy a pravděpodobnostní analýza, Cambridge, Velká Británie: Cambridge University Press, ISBN 978-0-521-83540-4
- ^ A b Short, Michael (2013), "Improved Inequalities for the Poisson and Binomial Distribution and Upper Tail Quantile Functions", ISRN Probability and Statistics, 2013: 412958, doi:10.1155/2013/412958
- ^ Kamath, Govinda M.; Şaşoğlu, Eren; Tse, David (2015), "Optimal Haplotype Assembly from High-Throughput Mate-Pair Reads", 2015 IEEE International Symposium on Information Theory (ISIT), 14–19 June, Hong Kong, China, pp. 914–918, arXiv:1502.01975, doi:10.1109/ISIT.2015.7282588, S2CID 128634
- ^ Prins, Jack (2012), "6.3.3.1. Counts Control Charts", e-Handbook of Statistical Methods, NIST/SEMATECH, vyvoláno 2019-09-20
- ^ Zhang, Huiming; Liu, Yunxiao; Li, Bo (2014), "Notes on discrete compound Poisson model with applications to risk theory", Pojištění: Matematika a ekonomie, 59: 325–336, doi:10.1016 / j.insmatheco.2014.09.012
- ^ Zhang, Huiming; Li, Bo (2016), "Characterizations of discrete compound Poisson distributions", Komunikace ve statistice - teorie a metody, 45 (22): 6789–6802, doi:10.1080/03610926.2014.901375, S2CID 125475756
- ^ McCullagh, Peter; Nelder, John (1989), Generalized Linear Models, Monographs on Statistics and Applied Probability, 37, London, UK: Chapman and Hall, ISBN 978-0-412-31760-6
- ^ Anscombe, Francis J. (1948), "The transformation of Poisson, binomial and negative binomial data", Biometrika, 35 (3–4): 246–254, doi:10.1093/biomet/35.3-4.246, JSTOR 2332343
- ^ Ross, Sheldon M. (2010), Úvod do pravděpodobnostních modelů (tenth ed.), Boston, MA, USA: Academic Press, ISBN 978-0-12-375686-2
- ^ "1.7.7 – Relationship between the Multinomial and Poisson | STAT 504".
- ^ Loukas, Sotirios; Kemp, C. David (1986), "The Index of Dispersion Test for the Bivariate Poisson Distribution", Biometrie, 42 (4): 941–948, doi:10.2307/2530708, JSTOR 2530708
- ^ Free Random Variables by D. Voiculescu, K. Dykema, A. Nica, CRM Monograph Series, American Mathematical Society, Providence RI, 1992
- ^ James A. Mingo, Roland Speicher: Free Probability and Random Matrices. Fields Institute Monographs, Vol. 35, Springer, New York, 2017.
- ^ Lectures on the Combinatorics of Free Probability by A. Nica and R. Speicher, pp. 203–204, Cambridge Univ. Press 2006
- ^ Paszek, Ewa. "Maximum Likelihood Estimation – Examples".
- ^ Garwood, Frank (1936), "Fiducial Limits for the Poisson Distribution", Biometrika, 28 (3/4): 437–442, doi:10.1093/biomet/28.3-4.437, JSTOR 2333958
- ^ Breslow, Norman E.; Day, Nick E. (1987), Statistical Methods in Cancer Research: Volume 2—The Design and Analysis of Cohort Studies, Lyon, France: Mezinárodní agentura pro výzkum rakoviny, ISBN 978-92-832-0182-3, archivovány z originál dne 8. 8. 2018, vyvoláno 2012-03-11
- ^ Fink, Daniel (1997), A Compendium of Conjugate Priors
- ^ Gelman; Carlin, John B .; Stern, Hal S .; Rubin, Donald B. (2003), Bayesovská analýza dat (2nd ed.), Boca Raton, FL, USA: Chapman & Hall/CRC, ISBN 1-58488-388-X
- ^ Clevenson, M. Lawrence; Zidek, James V. (1975), "Simultaneous Estimation of the Means of Independent Poisson Laws", Journal of the American Statistical Association, 70 (351): 698–705, doi:10.1080/01621459.1975.10482497, JSTOR 2285958
- ^ Berger, James O. (1985), Statistical Decision Theory and Bayesian Analysis, Springer Series in Statistics (2nd ed.), New York, NJ, USA: Springer-Verlag, doi:10.1007/978-1-4757-4286-2, ISBN 978-0-387-96098-2
- ^ Rasch, Georg (1963), "The Poisson Process as a Model for a Diversity of Behavioural Phenomena" (PDF), 17th International Congress of Psychology, 2, Washington, DC, USA, August 20th – 26th, 1963: American Psychological Association, doi:10.1037/e685262012-108CS1 maint: umístění (odkaz)
- ^ Flory, Paul J. (1940), "Molecular Size Distribution in Ethylene Oxide Polymers", Journal of the American Chemical Society, 62 (6): 1561–1565, doi:10.1021/ja01863a066
- ^ Lomnitz, Cinna (1994), Fundamentals of Earthquake Prediction, New York: John Wiley & Sons, ISBN 0-471-57419-8, OCLC 647404423
- ^ A b C von Bortkiewitsch, Ladislaus (1898), Das Gesetz der kleinen Zahlen [The law of small numbers] (in German), Leipzig, Germany: B. G. Teubner, p. Na Strana 1, Bortkiewicz presents the Poisson distribution. Na pages 23–25, Bortkiewitsch presents his analysis of "4. Beispiel: Die durch Schlag eines Pferdes im preußischen Heere Getöteten." (4. Example: Those killed in the Prussian army by a horse's kick.)
- ^ Student (1907), "On the Error of Counting with a Haemacytometer", Biometrika, 5 (3): 351–360, doi:10.2307/2331633, JSTOR 2331633
- ^ Boland, Philip J. (1984), "A Biographical Glimpse of William Sealy Gosset", Americký statistik, 38 (3): 179–183, doi:10.1080/00031305.1984.10483195, JSTOR 2683648
- ^ Erlang, Agner K. (1909), "Sandsynlighedsregning og Telefonsamtaler" [Probability Calculation and Telephone Conversations], Nyt Tidsskrift for Matematik (v dánštině), 20 (B): 33–39, JSTOR 24528622
- ^ Hornby, Dave (2014), Football Prediction Model: Poisson Distribution, Sports Betting Online, vyvoláno 2014-09-19
- ^ Koyama, Kento; Hokunan, Hidekazu; Hasegawa, Mayumi; Kawamura, Shuso; Koseki, Shigenobu (2016), "Do bacterial cell numbers follow a theoretical Poisson distribution? Comparison of experimentally obtained numbers of single cells with random number generation via computer simulation", Mikrobiologie potravin, 60: 49–53, doi:10.1016/j.fm.2016.05.019, PMID 27554145
- ^ Clarke, R. D. (1946), "An application of the Poisson distribution" (PDF), Časopis Ústavu pojistných matematiků, 72 (3): 481, doi:10.1017/S0020268100035435
- ^ Gallagher, Patrick X. (1976), "On the distribution of primes in short intervals", Mathematika, 23 (1): 4–9, doi:10.1112/s0025579300016442
- ^ Hardy, Godfrey H.; Littlewood, John E. (1923), „K některým problémům„ partitio numerorum “III: K vyjádření čísla jako součtu prvočísel“, Acta Mathematica, 44: 1–70, doi:10.1007 / BF02403921
- ^ Cameron, A. Colin; Trivedi, Pravin K. (1998), Regresní analýza dat o počtu, Cambridge, Velká Británie: Cambridge University Press, ISBN 978-0-521-63567-7
- ^ Edgeworth, Francis Y. (1913), „K použití teorie pravděpodobností ve statistikách týkajících se společnosti“, Journal of the Royal Statistical Society, 76 (2): 165–193, doi:10.2307/2340091, JSTOR 2340091
- ^ „Wolfram Language: PoissonDistribution reference page“. wolfram.com. Citováno 2016-04-08.
- ^ „Wolfram Language: MultivariatePoissonDistribution reference page“. wolfram.com. Citováno 2016-04-08.
- ^ Knuth, Donald Ervin (1997), Seminumerické algoritmy, Umění počítačového programování, 2 (3. vyd.), Addison Wesley, ISBN 978-0-201-89684-8
- ^ Devroye, Luc (1986), „Diskrétní jednorozměrné distribuce“ (PDF), Nerovnoměrné generování náhodných variací, New York, NJ, USA: Springer-Verlag, str. 485–553, doi:10.1007/978-1-4613-8643-8_10, ISBN 978-1-4613-8645-2
- ^ Poisson, Siméon D. (1837), Probabilité des jugements en matière criminelle et en matière civile, précédées des règles générales du calcul des probabilitiés [Výzkum pravděpodobnosti rozsudků v trestních a občanských věcech] (ve francouzštině), Paříž, Francie: Bachelier
- ^ de Moivre, Abraham (1711), „De mensura sortis, seu, de probabilitate eventuum in ludis a casu fortuito pendentibus“ [O měření šance, nebo o pravděpodobnosti událostí ve hrách v závislosti na náhodné šanci], Filozofické transakce královské společnosti (v latině), 27 (329): 213–264, doi:10.1098 / rstl.1710.0018
- ^ de Moivre, Abraham (1718), Nauka o šancích: Nebo metoda výpočtu pravděpodobnosti událostí ve hře, Londýn, Velká Británie: W. Pearson
- ^ de Moivre, Abraham (1721), „Of the Laws of Chance“, v Motte, Benjamin (ed.), Filozofické transakce z roku MDCC (kde končí pan Lowthorp) do roku MDCCXX. Abridg'd a Dispos'd pod hlavami generála (v latině), sv. I, Londýn, Velká Británie: R. Wilkin, R. Robinson, S. Ballard, W. a J. Innys a J. Osborn, s. 190–219
- ^ Stigler, Stephen M. (1982), „Poisson on the Poisson Distribution“, Statistika a pravděpodobnostní dopisy, 1 (1): 33–35, doi:10.1016/0167-7152(82)90010-4
- ^ Hald, Anders; de Moivre, Abraham; McClintock, Bruce (1984), „A. de Moivre:„ De Mensura Sortis “nebo„ O měření náhody “'", Mezinárodní statistický přehled / Revue Internationale de Statistique, 52 (3): 229–262, doi:10.2307/1403045, JSTOR 1403045
- ^ Newcomb, Simon (1860), „Poznámky k teorii pravděpodobností“, Matematický měsíčník, 2 (4): 134–140
Zdroje
- Ahrens, Joachim H .; Dieter, Ulrich (1974), „Počítačové metody pro vzorkování z gama, beta, poissonových a binomických distribucí“, Výpočetní, 12 (3): 223–246, doi:10.1007 / BF02293108, S2CID 37484126
- Ahrens, Joachim H .; Dieter, Ulrich (1982), „Počítačová generace Poissonových odchylek“, Transakce ACM na matematickém softwaru, 8 (2): 163–179, doi:10.1145/355993.355997, S2CID 12410131
- Evans, Ronald J .; Boersma, J .; Blachman, N.M .; Jagers, A. A. (1988), „Entropie Poissonovy distribuce: Problém 87–6“, Recenze SIAM, 30 (2): 314–317, doi:10.1137/1030059