Nejlepší lineární nezaujatá předpověď - Best linear unbiased prediction
v statistika, nejlepší lineární nezaujatá předpověď (BLUP) se používá v lineárním formátu smíšené modely pro odhad náhodné efekty. BLUP byl odvozen od Charles Roy Henderson v roce 1950, ale termín „nejlepší lineární nezaujatý prediktor“ (nebo „predikce“) se zdá být používán až v roce 1962.[1] „Nejlepší lineární nezaujaté předpovědi“ (BLUP) náhodných efektů jsou podobné nejlepším lineárním nezaujatým odhadům (BLUE) (viz Gauss – Markovova věta ) fixních efektů. Rozdíl vzniká proto, že se o něm mluví běžně odhadování pevné efekty, ale předpovídání náhodné efekty, ale oba pojmy jsou jinak rovnocenné. (To je trochu divné, protože náhodné účinky již byly „realizovány“; již existují. Použití termínu „predikce“ může být způsobeno tím, že v oblasti chovu zvířat, kde Henderson pracoval, byly náhodné účinky obvykle genetickou hodnotou , které by mohly být použity k předpovědi kvality potomků (Robinson[1] strana 28)). Rovnice pro „fixní“ efekty a pro náhodné efekty se však liší.
V praxi se často stává, že parametry spojené s termíny náhodných efektů nejsou známy; tyto parametry jsou odchylky náhodných efektů a reziduí. Parametry se obvykle odhadují a zapojují do prediktoru, což vede k Empirický nejlepší lineární nestranný prediktor (EBLUP). Všimněte si, že pouhým zapojením odhadovaného parametru do prediktoru se nezohlední další variabilita, což vede k příliš optimistickým odchylkám predikce pro EBLUP.[Citace je zapotřebí ]
Nejlepší lineární nezaujaté předpovědi jsou podobné empirický Bayes odhady náhodných účinků v lineárních smíšených modelech, kromě toho, že v druhém případě, kdy váhy závisí na neznámých hodnotách složek rozptylu, jsou tyto neznámé odchylky nahrazeny odhady založenými na vzorku.
Příklad
Předpokládejme, že model pro pozorování {Yj; j = 1, ..., n} je psán jako
kde ξj a εj představují náhodný efekt a chybu pozorování pro pozorování ja předpokládejme, že nesouvisejí a mají známé odchylky σξ2 a σε2, resp. Dále, Xj je vektorem nezávislé proměnné pro jpozorování a β je vektor regresních parametrů. BLUP problém poskytnutí odhadu bezchybné hodnoty pozorování pro kth postřeh,
lze formulovat tak, že vyžaduje, aby koeficienty lineárního prediktoru, definované jako
by měl být zvolen tak, aby se minimalizovala odchylka chyby predikce,
pod podmínkou, že prediktor je nestranný,
BLUP vs MODRÝ
Na rozdíl od případu nejlepší lineární nezaujatý odhad „množství k odhadu“, , má nejen příspěvek od náhodného prvku, ale zejména jednu z pozorovaných veličin což přispívá k , má také příspěvek od stejného náhodného prvku.
Na rozdíl od BLUE bere BLUP v úvahu známé nebo odhadované odchylky.[2]
Historie BLUP v chovu
Henderson zkoumal chov ze statistického hlediska. Jeho práce pomohla při vývoji indexu výběru (SI) a odhadované hodnoty chovu (EBV). Tyto statistické metody ovlivnily žebříčky umělých oplodnění AI používané ve Spojených státech. Tyto rané statistické metody jsou zaměňovány s BLUP nyní běžným v chovu hospodářských zvířat.
Samotný termín BLUP vznikl z práce na University of Guelph v Kanadě. V článku Odhad odpovědi na výběr metodou nejmenších čtverců a smíšeného modelu z ledna 1984 Journal of Animal Science 58 (5) DOI: 10,2527 / jas1984,5851097x od DA Sorensena a BW Kennedyho rozšířili Hendersonovy výsledky na model, který zahrnuje několik cyklů výběru. Tento model byl popularizován University of Guelph v mlékárenském průmyslu jako BLUP. Další práce univerzity ukázala BLUPovu nadřazenost nad EBV a SI, což vedlo k tomu, že se stala primárním genetickým prediktorem.
Existuje tedy zmatek mezi popularizovaným modelem BLUP a nejlepší statistickou metodou lineární nezaujaté predikce, která byla pro obecné použití příliš teoretická. Tento model byl dodán pro použití na počítačích farmářům.
V Kanadě se všechny mlékárny hlásí na národní úrovni. Genetika v Kanadě byla sdílena, což z ní dělá největší genetický fond a tím zdroj zlepšení. Toto a BLUP způsobily rychlý nárůst Holštýnský dobytek kvalitní.
Viz také
Poznámky
- ^ A b Robinson, G.K. (1991). „Ten BLUP je dobrá věc: Odhad náhodných efektů“. Statistická věda. 6 (1): 15–32. doi:10.1214 / ss / 1177011926. JSTOR 2245695. PAN 1108815. Zbl 0955.62500.
- ^ Stanek, Edward J. III; No, Arnolde; Ockene, Ira (1999). "Proč rutinně nepoužívat nejlepší lineární nezaujaté prediktory (BLUPy) jako odhady cholesterolu, procenta tuku z kcal a fyzické aktivity?". Statistika v medicíně. 18 (21): 2943–2959. doi:10.1002 / (sici) 1097-0258 (19991115) 18:21 <2943 :: aid-sim241> 3.0.co; 2-0.
Reference
- Henderson, C.R. (1975). Msgstr "Nejlepší lineární nezaujatý odhad a předpověď podle modelu výběru". Biometrie. 31 (2): 423–447. doi:10.2307/2529430. JSTOR 2529430. PMID 1174616.
- Liu, Xu-Qing; Rong, Jian-Ying; Liu, Xiu-Ying (2008). "Nejlepší lineární nezaujatá předpověď pro lineární kombinace v obecných smíšených lineárních modelech". Journal of Multivariate Analysis. 99 (8): 1503–1517. doi:10.1016 / j.jmva.2008.01.004.