Blokování (statistika) - Blocking (statistics) - Wikipedia
![]() | Tento článek obsahuje seznam obecných Reference, ale zůstává z velké části neověřený, protože postrádá dostatečné odpovídající vložené citace.Ledna 2018) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
V statistický teorie návrh experimentů, blokování je aranžování experimentální jednotky ve skupinách (blocích), které jsou si navzájem podobné.
Použití
Blokování snižuje nevysvětlitelnou variabilitu. Jeho princip spočívá ve skutečnosti, že variabilita, kterou nelze překonat (např. Potřeba dvou dávek suroviny k výrobě 1 nádoby s chemikálií) je zmatený nebo aliasem interakce (n) (vyšší / nejvyšší řád), aby se eliminoval jeho vliv na konečný produkt. Vysoká objednávka interakce jsou obvykle nejméně důležité (myslete na to, že teplota reaktoru nebo šarže surovin je důležitější než kombinace těchto dvou - to platí zejména tehdy, když je přítomno více (3, 4, ...) faktorů ); proto je lepší zaměnit tuto variabilitu s vyšší interakcí.
Příklady
- Muži a ženy: Cílem experimentu je otestovat nový lék na pacientech. Existují dvě úrovně léčby, lék, a placebo, podáváno mužský a ženský pacienti v a dvojitá slepá soud. Pohlaví pacienta je a blokování faktor účetnictví pro variabilitu léčby mezi muži a ženy. To snižuje zdroje variability a vede tak k větší přesnosti.
- Nadmořská výška: Cílem experimentu je otestovat účinky nového pesticidu na konkrétní část trávy. Travnatá plocha obsahuje zásadní změnu nadmořské výšky, a proto se skládá ze dvou odlišných oblastí - „vysoké nadmořské výšky“ a „nízké nadmořské výšky“. Skupina ošetření (nový pesticid) a skupina s placebem se aplikují jak na vysokohorské, tak na nízkoenergetické oblasti trávy. V tomto případě výzkumník blokuje elevační faktor, který může odpovídat za variabilitu v aplikaci pesticidů.
- Zásah: Předpokládejme, že je vynalezen proces, jehož cílem je, aby podrážky obuvi vydržely déle, a je vytvořen plán pro provedení polní zkoušky. Vzhledem ke skupině n dobrovolníků, jedním z možných návrhů by bylo dát n / 2 z toho boty s novými podešvemi a n / 2 z toho boty s obyčejnými podešvemi, randomizace přiřazení dvou druhů podrážek. Tento typ experimentu je a zcela náhodný design. Obě skupiny jsou poté požádány, aby po určitou dobu používaly své boty, a poté změří stupeň opotřebení chodidel. Jedná se o proveditelný experimentální návrh, ale čistě z hlediska statistické přesnosti (ignorování dalších faktorů) by lepší návrh byl dát každé osobě jednu pravidelnou podrážku a jednu novou podrážku, která náhodně přiřadí dva typy doleva a správná bota každého dobrovolníka. Takový design se nazývá „náhodně dokončený blokový design "Tento design bude citlivější než ten první, protože každý člověk jedná jako jeho vlastní kontrola, a tedy jako kontrolní skupina je těsněji spjat s léčená skupina.
Náhodný design bloku
V statistický teorie návrh experimentů, blokování je aranžování experimentální jednotky ve skupinách (blocích), které jsou si navzájem podobné. Typickým zdrojem blokujícího faktoru je variabilita to není pro experimentátora primárním zájmem. Příkladem blokujícího faktoru může být pohlaví pacienta; blokováním sexu je tento zdroj variability kontrolován, což vede k větší přesnosti.
V teorii pravděpodobnosti metoda bloků spočívá v rozdělení vzorku na bloky (skupiny) oddělené menšími dílčími bloky, takže bloky lze považovat za téměř nezávislé. Metoda bloky pomáhá prokázat limitní věty v případě závislých náhodných proměnných.
Metodu bloků zavedl S. Bernstein:
Bernstein S.N. (1926) Sur l'extension du théorème limite du calcul des probabilités aux sommes de quantités dépendantes. Matematika. Annalen, v. 97, 1-59.
Metoda byla úspěšně aplikována v teorii součtů závislých náhodných proměnných a v teorii extrémní hodnoty:
Ibragimov I.A. a Linnik Yu.V. (1971) Nezávislé a stacionární sekvence náhodných proměnných. Wolters-Noordhoff, Groningen.
Leadbetter M.R., Lindgren G. a Rootzén H. (1983) Extrémy a související vlastnosti náhodných sekvencí a procesů. New York: Springer Verlag.
Novak S.Y. (2011) Extreme Value Methods with Applications to Finance. Chapman & Hall / CRC Press, Londýn.
Blokování se používá pro obtěžující faktory, které lze ovládat
Když můžeme ovládat obtěžující faktory, lze použít důležitou techniku známou jako blokování ke snížení nebo vyloučení příspěvku k experimentální chybě přispívající k obtěžujícím faktorům. Základním konceptem je vytvoření homogenních bloků, ve kterých jsou udržovány konstantní faktory obtěžování a je dovoleno měnit faktor zájmu. V rámci bloků je možné posoudit účinek různých úrovní sledovaného faktoru, aniž byste se museli starat o variace způsobené změnami blokových faktorů, které jsou v analýze zohledněny.
Definice blokujících faktorů
Faktor obtěžování se používá jako blokující faktor, pokud se každá úroveň primárního faktoru vyskytuje s každou úrovní faktoru obtěžování stejný počet opakování. Analýza experimentu se zaměří na účinek různých úrovní primárního faktoru v každém bloku experimentu.
Blokujte několik nejdůležitějších obtěžujících faktorů
Obecné pravidlo je:
- "Blokuj, co můžeš; náhodně, co nemůžete. “
Blokování se používá k odstranění účinků několika nejdůležitějších obtěžujících proměnných. Randomizace se poté použije ke snížení kontaminujících účinků zbývajících obtěžujících proměnných. U důležitých proměnných obtěžování blokování přinese vyšší význam v proměnných zájmu než randomizace.
Stůl
Jedním z užitečných způsobů, jak se podívat na experiment s randomizovaným blokem, je považovat ho za kolekci zcela náhodně každý experiment probíhá v jednom z bloků celkového experimentu.
Název vzoru | Počet faktorů k | Počet běhů n |
---|---|---|
2-faktor RBD | 2 | L1 * L2 |
3faktorové RBD | 3 | L1 * L2 * L3 |
4faktorové RBD | 4 | L1 * L2 * L3 * L4 |
k-faktor RBD | k | L1 * L2 * * Lk |
s
- L1 = počet úrovní (nastavení) faktoru 1
- L2 = počet úrovní (nastavení) faktoru 2
- L3 = počet úrovní (nastavení) faktoru 3
- L4 = počet úrovní (nastavení) faktoru 4
- Lk = počet úrovní (nastavení) faktoru k
Příklad
Předpokládejme, že inženýři ve výrobním závodě na výrobu polovodičů chtějí otestovat, zda mají různé dávky materiálu implantátu oplatky významný vliv na měření odporu po procesu difúze probíhajícím v peci. Mají čtyři různé dávky, které chtějí vyzkoušet, a dostatek experimentálních oplatek ze stejné šarže pro spuštění tří oplatek při každé z dávek.
Faktorem obtěžování, kterého se týkají, je „chod pece“, protože je známo, že každý chod pece se liší od posledního a ovlivňuje mnoho parametrů procesu.
Ideálním způsobem, jak spustit tento experiment, by bylo spustit všechny oplatky 4x3 = 12 ve stejném chodu pece. To by zcela eliminovalo faktor obtěžující pece. Pravidelné výrobní destičky však mají prioritu pece a do libovolného chodu pece je povoleno současně jen několik experimentálních destiček.
Neblokovaným způsobem provedení tohoto experimentu by bylo spuštění každé z dvanácti experimentálních destiček v náhodném pořadí, jedna na jednu pec. To by zvýšilo experimentální chybu každého měření rezistivity o variabilitu pece typu run-to-run a ztěžovalo by studium účinků různých dávek. Blokovaným způsobem, jak tento experiment spustit, za předpokladu, že můžete přesvědčit výrobu, aby vám umožnila umístit čtyři experimentální oplatky do běhu pece, by bylo dát čtyři oplatky s různými dávkami do každého ze tří běhů pece. Jedinou randomizací by byl výběr, který ze tří oplatek s dávkou 1 by šel do chodu pece 1, a podobně pro oplatky s dávkami 2, 3 a 4.
Popis experimentu
Nechat X1 být dávkována "úroveň" a X2 být chod pece s blokujícím faktorem. Potom lze experiment popsat takto:
- k = 2 faktory (1 primární faktor X1 a 1 blokovací faktor X2)
- L1 = 4 úrovně faktoru X1
- L2 = 3 úrovně faktoru X2
- n = 1 replikace na buňku
- N = L1 * L2 = 4 * 3 = 12 běhů
Před randomizací vypadají zkušební verze takto:
X1 | X2 |
---|---|
1 | 1 |
1 | 2 |
1 | 3 |
2 | 1 |
2 | 2 |
2 | 3 |
3 | 1 |
3 | 2 |
3 | 3 |
4 | 1 |
4 | 2 |
4 | 3 |
Maticová reprezentace
Alternativním způsobem shrnutí návrhových zkoušek by bylo použití matice 4x3, jejíž 4 řádky jsou úrovně léčby X1 a jejichž sloupce jsou 3 úrovně blokující proměnné X2. Buňky v matici mají indexy, které odpovídají X1, X2 kombinace výše.
Léčba | Blok 1 | Blok 2 | Blok 3 |
---|---|---|---|
1 | 1 | 1 | 1 |
2 | 1 | 1 | 1 |
3 | 1 | 1 | 1 |
4 | 1 | 1 | 1 |
V širším smyslu si povšimněte, že zkoušky pro jakýkoli návrh randomizovaného bloku s K-faktorem jsou jednoduše buněčné indexy a k rozměrová matice.
Modelka
Model pro návrh randomizovaného bloku s jednou obtěžující proměnnou je
kde
- Yij je jakékoli pozorování, pro které X1 = i a X2 = j
- X1 je primární faktor
- X2 je blokovací faktor
- μ je obecný parametr umístění (tj. průměr)
- Ti je účinek léčby i (faktoru X1)
- Bj je účinek bytí v bloku j (faktoru X2)
Odhady
- Odhad pro μ: = průměr všech údajů
- Odhad pro Ti : s = průměr ze všech Y pro který X1 = i.
- Odhad pro Bj : s = průměr ze všech Y pro který X2 = j.
Zobecnění
- Zobecněné randomizované návrhy bloků (GRBD) umožňují testy interakce blokování léčby a má přesně jeden blokující faktor, jako je RCBD.
- Latinské čtverce (a další návrhy řádků a sloupců) mají dva blokovací faktory, o nichž se předpokládá, že nemají žádnou interakci.
- Latinské hyperkrychle vzorkování
- Řecko-latinské čtverce
- Hypergreco-latinský čtvercový design
Teoretický základ
Teoretickým základem blokování je následující matematický výsledek. Vzhledem k náhodným proměnným X a Y
Rozdílu mezi léčbou a kontrolou lze tedy dát minimální rozptyl (tj. Maximální přesnost) maximalizací kovariance (nebo korelace) mezi X a Y.
Viz také
- Algebraické statistiky
- Blokový design
- Kombinatorický design
- Zobecněný design randomizovaného bloku
- Glosář experimentálního designu
- Optimální design
- Test spárovaného rozdílu
- Náhodný design bloku
- Závislé a nezávislé proměnné
Reference
Tento článek zahrnujepublic domain materiál z Národní institut pro standardy a technologie webová stránka https://www.nist.gov.
Bibliografie
- Addelman, S. (1969). "Zevšeobecněný náhodný návrh bloku". Americký statistik. 23 (4): 35–36. doi:10.2307/2681737. JSTOR 2681737.
- Addelman, S. (1970). "Variabilita ošetření a experimentálních jednotek při navrhování a analýze experimentů". Journal of the American Statistical Association. 65 (331): 1095–1108. doi:10.2307/2284277. JSTOR 2284277.
- Anscombe, F.J. (1948). "Platnost srovnávacích experimentů". Journal of the Royal Statistical Society. Generál). 111 (3): 181–211. doi:10.2307/2984159. JSTOR 2984159. PAN 0030181.
- Bailey, R. A. (2008). Návrh srovnávacích experimentů. Cambridge University Press. ISBN 978-0-521-68357-9. Archivovány od originál dne 22.03.2018. Kapitoly před vydáním jsou k dispozici online.
- Bapat, R. B. (2000). Lineární algebra a lineární modely (Druhé vydání.). Springer. ISBN 978-0-387-98871-9.
- Caliński T. & Kageyama S. (2000). Blokové návrhy: Randomizační přístup, svazek Já: Analýza. Poznámky k přednášce ve statistice. 150. New York: Springer-Verlag. ISBN 0-387-98578-6.
- Caliński T. & Kageyama S. (2003). Blokové vzory: Randomizační přístup, svazek II: Design. Poznámky k přednášce ve statistice. 170. New York: Springer-Verlag. ISBN 0-387-95470-8. PAN 1994124.
- Gates, C.E. (listopad 1995). "Co opravdu je experimentální chyba v blokových návrzích?". Americký statistik. 49 (4): 362–363. doi:10.2307/2684574. JSTOR 2684574.
- Kempthorne, Oscar (1979). Návrh a analýza experimentů (Opravený dotisk (1952) Wiley ed.). Robert E. Krieger. ISBN 0-88275-105-0.
- Hinkelmann, Klaus a Kempthorne, Oscar (2008). Návrh a analýza experimentů. I a II (druhé vydání). Wiley. ISBN 978-0-470-38551-7.CS1 maint: více jmen: seznam autorů (odkaz)
- Hinkelmann, Klaus a Kempthorne, Oscar (2008). Návrh a analýza experimentů, svazek I: Úvod do experimentálního designu (Druhé vydání.). Wiley. ISBN 978-0-471-72756-9.CS1 maint: více jmen: seznam autorů (odkaz)
- Hinkelmann, Klaus a Kempthorne, Oscar (2005). Design and Analysis of Experiments, Volume 2: Advanced Experimental Design (První vydání). Wiley. ISBN 978-0-471-55177-5.CS1 maint: více jmen: seznam autorů (odkaz)
- Lentner, Marvin; Thomas Bishop (1993). "Zobecněný design RCB (kapitola 6.13)". Experimentální návrh a analýza (Druhé vydání.). P.O. Box 884, Blacksburg, VA 24063: Valley Book Company. str. 225–226. ISBN 0-9616255-2-X.CS1 maint: umístění (odkaz)
- Raghavarao, Damaraju (1988). Konstrukce a kombinatorické problémy při navrhování experimentů (opravený dotisk edice Wiley z roku 1971). New York: Dover. ISBN 0-486-65685-3.
- Raghavarao, Damaraju a Padgett, L.V. (2005). Blokové vzory: analýza, kombinatorika a aplikace. World Scientific. ISBN 981-256-360-1.CS1 maint: více jmen: seznam autorů (odkaz)
- Shah, Kirti R. & Sinha, Bikas K. (1989). Teorie optimálních návrhů. Poznámky k přednášce ve statistice. 54. Springer-Verlag. 171 + viii. ISBN 0-387-96991-8.
- Ulice, Anne Penfoldová; Ulice, Deborah J. (1987). Kombinatorika experimentálního designu. Oxford U. P. [Clarendon]. ISBN 0-19-853256-3.
- Wilk, M. B. (1955). "Randomizační analýza generalizovaného návrhu randomizovaného bloku". Biometrika. 42 (1–2): 70–79. doi:10.2307/2333423. JSTOR 2333423.
- Zyskind, George (1963). „Některé důsledky randomizace při zobecnění vyváženého neúplného návrhu bloku“. Annals of Mathematical Statistics. 34 (4): 1569–1581. doi:10.1214 / aoms / 1177703889. JSTOR 2238364.