Probit - Probit
![]() | tento článek může být pro většinu čtenářů příliš technická na to, aby je pochopili. Prosím pomozte to vylepšit na aby to bylo srozumitelné pro neodborníky, aniž by byly odstraněny technické podrobnosti. (Leden 2013) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) |

v teorie pravděpodobnosti a statistika, probit funkce je kvantilová funkce spojené se standardem normální distribuce, který se běžně označuje jako N (0,1). Matematicky je to inverzní funkce k kumulativní distribuční funkce standardního normálního rozdělení, které je označeno jako , takže probit je označen jako . Má aplikace v průzkumná statistická grafika a specializované regresní modelování proměnných binární odezvy.
Z velké části kvůli teorém centrálního limitu, standardní normální rozdělení hraje zásadní roli v teorii pravděpodobnosti a statistice. Pokud vezmeme v úvahu známý fakt, že standardní normální rozdělení umístí 95% pravděpodobnosti mezi -1,96 a 1,96 a je symetrické kolem nuly, vyplývá z toho, že
Funkce probit poskytuje „inverzní“ výpočet a generuje hodnotu náhodné proměnné N (0,1) spojené se specifikovanou kumulativní pravděpodobností. Pokračování příkladu,
- .
Obecně,
- a
Koncepční vývoj
Myšlenku probitové funkce publikoval Chester Ittner Bliss v článku z roku 1934 v Věda o tom, jak zacházet s údaji, jako je procento škůdce zabitého a pesticid.[1] Bliss navrhl převést procento zabitých na „probschopnost unto„(nebo„ probit “), který lineárně souvisel s moderní definicí (definoval ji libovolně jako rovnou 0 pro 0,0001 a 1 pro 0,9999). Zahrnul tabulku, která pomohla ostatním vědcům převést jejich procenta zabití na jeho probit, který oni by pak mohli spiknout proti logaritmu dávky a tím, jak se doufalo, získat víceméně přímku. Takový tzv. probit model je stále důležitý v toxikologii i v jiných oblastech. Tento přístup je oprávněný, zejména pokud lze variaci odezvy racionalizovat jako a lognormální distribuce tolerancí mezi testovanými subjekty, kde tolerance konkrétního subjektu je dávka dostatečná pouze pro sledovanou odpověď.
Metoda zavedená Blissem byla přenesena dovnitř Analýza problému, důležitý text o toxikologických aplikacích od D. J. Finney.[2][3] Hodnoty předložené Finneym lze odvodit z probitů, jak jsou zde definovány, přidáním hodnoty 5. Tento rozdíl shrnuje Collett (str. 55):[4] „Původní definice probita [s 5 přidanými] byla především proto, aby se zabránilo nutnosti pracovat s negativními probity; ... Tato definice se v některých čtvrtletích stále používá, ale v hlavních statistických softwarových balíčcích pro to, co se označuje jako probit analýza, probity jsou definovány bez přidání 5. "Je třeba poznamenat, že metodika probitů, včetně numerické optimalizace pro přizpůsobení probitových funkcí, byla zavedena před širokou dostupností elektronických výpočtů. Při použití tabulek bylo vhodné mít probity jednotně pozitivní." Společné oblasti použití nevyžadují pozitivní pravděpodobnosti.
Diagnostika odchylky distribuce od normality
Kromě poskytnutí základu pro důležité typy regrese je funkce probit užitečná ve statistické analýze pro diagnostiku odchylek od normality podle metody Q-Q vykreslování. Pokud je soubor dat ve skutečnosti a vzorek a normální distribuce, graf hodnot proti jejich probitovým výsledkům bude přibližně lineární. Specifické odchylky od normality jako např asymetrie, těžké ocasy nebo bimodalita lze diagnostikovat na základě detekce specifických odchylek od linearity. Zatímco graf Q-Q lze použít pro srovnání s jakoukoli distribuční rodinou (nejen normální), normální graf Q-Q je relativně standardní procedura analýzy průzkumných dat, protože předpokladem normality je často výchozí bod pro analýzu.
Výpočet
Normální distribuce CDF a její inverzní funkce nejsou k dispozici v uzavřená forma a výpočet vyžaduje pečlivé použití numerických postupů. Funkce jsou však široce dostupné v softwaru pro statistiku a modelování pravděpodobnosti a v tabulkách. v Microsoft Excel například funkce probit je k dispozici jako norm.s.inv (p). Ve výpočetních prostředích, kde numerické implementace funkce inverzní chyby jsou k dispozici, probitovou funkci lze získat jako
Příkladem je MATLAB, kde je k dispozici funkce „erfinv“. Jazyk Mathematica implementuje 'InverseErf'. Jiná prostředí přímo implementují funkci probit, jak je znázorněno v následující relaci v Programovací jazyk R..
> qnorm(0.025)[1] -1.959964> pnorm(-1.96)[1] 0.02499790
Podrobnosti pro výpočet funkce inverzní chyby najdete na [1]. Wichura poskytuje rychlý algoritmus pro výpočet probitové funkce na 16 desetinných míst; toto se používá v R ke generování náhodných variací pro normální rozdělení.[5]
Obyčejná diferenciální rovnice pro probitovou funkci
Další způsob výpočtu je založen na vytvoření nelineární obyčejné diferenciální rovnice (ODE) pro probita podle Steinbrecherovy a Shawovy metody.[6] Zkrácení funkce probit na , ODR je
kde je funkce hustoty pravděpodobnosti w.
V případě Gaussian:
Opětovné rozlišení:
se středovými (počátečními) podmínkami
Tuto rovnici lze vyřešit několika metodami, včetně přístupu klasické energetické řady. Z toho lze vyvinout řešení libovolně vysoké přesnosti na základě Steinbrecherova přístupu k řadě funkcí inverzní chyby. Řešení řady napájení je dáno vztahem
kde koeficienty uspokojit nelineární opakování
s . V této formě poměr tak jako .
Viz také

Úzce souvisí s probitovou funkcí (a probit model ) jsou logit funkce a logitový model. Inverzní hodnota logistické funkce je dána vztahem
Analogicky k modelu probit můžeme předpokládat, že taková veličina souvisí lineárně se sadou prediktorů, což má za následek logitový model, základ zejména logistická regrese model, nejrozšířenější forma regresní analýza pro kategorická data odpovědí. V současné statistické praxi jsou modely probit a logit regresní často řešeny jako případy zobecněný lineární model.
Viz také
- Chyba detekce kompromisu grafy (grafy DET, alternativa k ROC)
- Logistická regrese (a.k.a. logit model)
- Logit
- Probit model
- Multinomiální probit
- Děj Q-Q
- Kontinuální funkce
- Monotónní funkce
- Kvantilní funkce
- Sigmoidní funkce
- Rankit analýza, kterou vyvinul také Chester Bliss
- Ridit bodování
Reference
- ^ Bliss CI. (1934). "Metoda probitů". Věda. 79 (2037): 38–39. doi:10.1126 / science.79.2037.38. JSTOR 1659792. PMID 17813446.
- ^ Finney, D.J. (1947), Analýza problému. (1. vydání) Cambridge University Press, Cambridge, UK.
- ^ Finney, D.J. (1971). Probit Analysis (3. vydání). Cambridge University Press, Cambridge, Velká Británie. ISBN 0-521-08041-X. OCLC 174198382.
- ^ Collett, D. (1991). Modelování binárních dat. Chapman and Hall / CRC.
- ^ Wichura, M. J. (1988). "Algoritmus AS241: Procentní body normálního rozdělení". Aplikovaná statistika. Blackwell Publishing. 37 (3): 477–484. doi:10.2307/2347330. JSTOR 2347330.
- ^ Steinbrecher, G., Shaw, W.T. (2008). "Kvantilní mechanika". European Journal of Applied Mathematics. 19 (2): 87–112. doi:10.1017 / S0956792508007341.CS1 maint: více jmen: seznam autorů (odkaz)