P – P děj - P–P plot - Wikipedia
Ve statistikách a P – P děj (pravděpodobnost – graf pravděpodobnosti nebo procento – procentní spiknutí nebo Graf hodnoty P) je graf pravděpodobnosti pro posouzení, jak blízko dva datové sady souhlasím, který je vykresluje kumulativní distribuční funkce proti sobě. P-P grafy jsou velmi používány k vyhodnocení šikmost distribuce.
The Graf Q – Q je široce používán, ale oba jsou označováni jako "pravděpodobnostní" graf a jsou potenciálně zaměňováni.
Definice
P-P plot vykresluje dva kumulativní distribuční funkce (CDF) proti sobě:[1]dané dvě rozdělení pravděpodobnosti, s cdfs "F" a "G", vykresluje to tak jako z se pohybuje od na Protože soubor cdf má rozsah [0,1], doména tohoto parametrického grafu je a rozsah je jednotkový čtverec
Tedy pro vstup z výstup je dvojice čísel udávající co procento z F a co procento z G spadnout na nebo pod z.
Srovnávací přímkou je čára 45 ° od (0,0) do (1,1) - distribuce jsou stejné právě tehdy, když graf spadá na tuto linii - jakákoli odchylka označuje rozdíl mezi distribucemi.[2]
Příklad
Například pokud se obě distribuce nepřekrývají, řekněme F je níže G, pak se P – P děj bude pohybovat zleva doprava po spodní části čtverce - jako z se pohybuje přes podporu F, CDF F jde z 0 na 1, zatímco cdf z G zůstane na 0 - a poté se posune nahoru na pravou stranu čtverce - cdf z F je nyní 1, jako všechny body F leží pod všemi body G, a nyní CDF G pohybuje se od 0 do 1 jako z se pohybuje přes podporu G. (k tomuto odstavci potřebujete graf)
Použití
Jak ilustruje výše uvedený příklad, jsou-li dvě rozdělení rozdělena v prostoru, graf P – P poskytne velmi málo dat - je to užitečné pouze pro porovnání rozdělení pravděpodobnosti, která mají blízké nebo stejné umístění. Zejména projde bodem (1/2, 1/2) právě tehdy, pokud mají obě distribuce stejné medián.
P – P grafy jsou někdy omezeny na srovnání mezi dvěma vzorky, spíše než na srovnání vzorku s teoretickým rozdělením modelu.[3] Jsou však obecně použitelné, zejména tam, kde pozorování nejsou modelována se stejnou distribucí.
Zjistil však určité použití při porovnávání distribuce vzorků z a známý teoretické rozdělení: dané n vzorků, vynesením souvislého teoretického CDF proti empirickému CDF by se získal schodiště (krok jako z zasáhne vzorek) a zasáhne horní část čtverce, když je zasažen poslední datový bod. Místo toho jeden pouze vykresluje body a vykresluje pozorované kpozorované body (v pořadí: formálně pozorované kstatistika th pořadí) proti k/(n + 1) kvantil teoretického rozdělení.[3] Tato volba „polohy vykreslení“ (volba kvantilu teoretického rozdělení) vyvolala menší kontroverzi než volba pro Q – Q grafy. Výsledná správnost uložení 45 ° čáry poskytuje měřítko rozdílu mezi sadou vzorků a teoretickým rozdělením.
Graf P – P lze použít jako grafický doplněk k testům shody rozdělení pravděpodobnosti,[4][5] přičemž na pozemku jsou zahrnuty další řádky, které označují buď konkrétní oblasti přijatelnosti, nebo rozsah očekávaného odchodu z řádku 1: 1. K dispozici je vylepšená verze grafu P – P, zvaná graf SP nebo S – P,[4][5] který využívá a varianta stabilizující transformaci k vytvoření grafu, na kterém by měly být variace kolem čáry 1: 1 na všech místech stejné.
Viz také
Reference
Citace
- ^ Neparametrický statistický závěr podle Jean Dickinson Gibbons, Subhabrata Chakraborti, 4. vydání, CRC Press, 2003, ISBN 978-0-8247-4052-8, str. 145
- ^ Derrick, B; Toher, D; White, P (2016). „Proč je test Welchs robustní s chybou typu I“. Kvantitativní metody pro psychologii. 12 (1): 30–38. doi:10.20982 / tqmp.12.1.p030.
- ^ A b Testování normality „Henry C. Thode, CRC Press, 2002, ISBN 978-0-8247-9613-6, Oddíl 2.2.3, Procenta-procenta grafů, str. 23
- ^ A b Michael J.R. (1983) „Stabilizovaný graf pravděpodobnosti“. Biometrika, 70(1), 11–17. JSTOR 2335939
- ^ A b Shorack, G.R., Wellner, J.A (1986) Empirické procesy s aplikacemi pro statistikuWiley. ISBN 0-471-86725-X p248–250
Zdroje
- Davidson, Russell; MacKinnon, James (leden 1998). "Grafické metody pro zkoumání velikosti a síly testů hypotéz". Manchester School. 66 (1): 1–26. CiteSeerX 10.1.1.57.4335. doi:10.1111/1467-9957.00086.