Zkrácená distribuce - Truncated distribution
![]() | tento článek potřebuje další citace pro ověření.Září 2009) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Funkce hustoty pravděpodobnosti ![]() Funkce hustoty pravděpodobnosti pro zkrácené normální rozdělení pro různé sady parametrů. Ve všech případech, A = −10 a b = 10. Pro černou: μ = −8, σ = 2; modrý: μ = 0, σ = 2; Červené: μ = 9, σ = 10; oranžový: μ = 0, σ = 10. | |||
Podpěra, podpora | |||
---|---|---|---|
CDF | |||
Znamenat | |||
Medián |
v statistika, a zkrácená distribuce je podmíněné rozdělení který vyplývá z omezení domény jiných rozdělení pravděpodobnosti. Zkrácené distribuce vznikají v praktické statistice v případech, kdy je schopnost zaznamenávat nebo dokonce vědět o událostech omezena na hodnoty, které leží nad nebo pod danou prahovou hodnotou nebo ve stanoveném rozsahu. Například pokud se zkoumají data narození dětí ve škole, obvykle by byla zkrácena ve srovnání s daty všech dětí v dané oblasti, protože škola přijímá k určitému datu pouze děti v daném věkovém rozmezí. Nebyly by k dispozici žádné informace o tom, kolik dětí v lokalitě mělo data narození před nebo po datu ukončení školy, pokud by k získání informací byl použit pouze přímý přístup ke škole.
Tam, kde je vzorkování takové, aby si udrželo znalosti o položkách, které spadají mimo požadovaný rozsah, aniž by byly zaznamenány skutečné hodnoty, je to známé jako cenzura, na rozdíl od zkrácení tady.[1]
Definice
Následující diskuse se týká náhodné proměnné mající a kontinuální distribuce i když platí stejné myšlenky diskrétní distribuce. Podobně diskuse předpokládá, že zkrácení je na polootevřeném intervalu y ∈ (a, b] ale další možnosti lze řešit přímo.
Předpokládejme, že máme náhodnou proměnnou, který je distribuován podle nějaké funkce hustoty pravděpodobnosti, , s kumulativní distribuční funkcí oba jsou nekonečné Podpěra, podpora. Předpokládejme, že chceme znát hustotu pravděpodobnosti náhodné proměnné po omezení podpory mezi dvě konstanty tak, aby podpora, . To znamená, předpokládejme, že chceme vědět jak je distribuován daný .
kde pro všechny a všude jinde. To znamená, kde je indikátorová funkce. Všimněte si, že jmenovatel ve zkrácené distribuci je konstantní vzhledem k .
Všimněte si, že ve skutečnosti je hustota:
- .
Zkrácené distribuce nemusí mít části odstraněné z horní a dolní části. Zkrácená distribuce, kde byla odstraněna pouze spodní část distribuce, je následující:
kde pro všechny a všude jinde a je kumulativní distribuční funkce.
Zkrácená distribuce, kde byla odstraněna horní část distribuce, je následující:
kde pro všechny a všude jinde a je kumulativní distribuční funkce.
Očekávání zkrácené náhodné proměnné
Předpokládejme, že chceme najít očekávanou hodnotu náhodné proměnné rozdělené podle hustoty a kumulativní distribuce vzhledem k tomu, že náhodná proměnná, , je větší než nějaká známá hodnota . Očekávání zkrácené náhodné proměnné je tedy:
kde zase je pro všechny a všude jinde.
Pronájem a být dolní a horní hranice podpory funkce původní hustoty (o kterém předpokládáme, že je spojitý), vlastnosti , kde je spojitá funkce se spojitou derivací, patří:
(i)
ii)
(iii)
a
(iv)
(proti)
Za předpokladu, že existují limity, to je: , a kde představuje buď nebo .
Příklady
The zkrácené normální rozdělení je důležitým příkladem.[2]
The Tobitův model používá zkrácené distribuce. Mezi další příklady patří zkrácený binomický kmitočet při x = 0 a zkrácený poisson při x = 0.
Náhodné zkrácení
Předpokládejme, že máme následující nastavení: zkrácená hodnota, , je náhodně vybrán z hustoty, , ale tato hodnota není dodržena. Pak hodnota, , je náhodně vybráno ze zkrácené distribuce, . Předpokládejme, že to pozorujeme a přejeme si aktualizovat naši víru o hustotě vzhledem k pozorování.
Nejprve podle definice:
- , a
Všimněte si toho musí být větší než , tedy když se integrujeme znovu , nastavili jsme dolní hranici . Funkce a jsou bezpodmínečná hustota a bezpodmínečná kumulativní distribuční funkce.
Podle Bayesovo pravidlo,
který se rozšiřuje na
Dvě rovnoměrná rozdělení (příklad)
Předpokládejme, že to víme t je rovnoměrně distribuováno od [0,T] a X|t je distribuováno jednotně na [0,t]. Nechat G(t) a F(X|t) být hustoty, které popisují t a X resp. Předpokládejme, že sledujeme hodnotu X a chcete znát distribuci t vzhledem k této hodnotě X.