Vzorkovací rám - Sampling frame
v statistika, a vzorkovací rám je zdrojový materiál nebo zařízení, ze kterého a vzorek je nakreslena.[1] Je to seznam všech těch, kteří jsou v a populace kteří mohou být zařazeni do vzorku a mohou zahrnovat jednotlivce, domácnosti nebo instituce.[1]
Důležitost vzorkovacího rámečku zdůrazňuje Jessen[2] a Salant a Dillman.[3]
V mnoha praktických situacích je rám pro plánovače průzkumu otázkou a někdy kritickou. [...] Některá velmi užitečná vyšetřování nejsou vůbec prováděna kvůli nedostatku zjevného rámce; jiné kvůli vadným rámům skončily katastrofou nebo v oblaku pochyb.
— Raymond James Jessen
Získání a organizace rámce vzorkování
V nejpřímějších případech, například při nakládání s dávkou materiálu z výrobního cyklu nebo při použití sčítání lidu, je možné identifikovat a měřit každou jednotlivou položku v populaci a zahrnout kteroukoli z nich do našeho vzorku; toto je známé jako přímé vzorkování prvků.[1] V mnoha jiných případech to však není možné; buď proto, že je to neúnosné (zasáhnout každého občana země) nebo nemožné (zasáhnout všechny živé lidi).
Po vytvoření rámce existuje řada způsobů, jak jej organizovat, aby se zlepšila účinnost a účinnost. V této fázi by měl výzkumný pracovník rozhodnout, zda ve skutečnosti má být vzorkem celá populace, a tedy by byl sčítání lidu.
Tento seznam by měl také usnadnit přístup k vybranému odběru vzorků Jednotky. Rámec může také poskytovat další „pomocné informace“ o svých prvcích; pokud se tyto informace vztahují k proměnným nebo zájmovým skupinám, lze je použít ke zlepšení designu průzkumu. I když to není nutné pro jednoduché vzorkování, vzorkovací rámec používaný pro pokročilejší techniky vzorkování, jako je stratifikovaný odběr vzorků, může obsahovat další informace (např demografická informace ).[1] Například volební rejstřík může obsahovat jméno a pohlaví; tyto informace lze použít k zajištění toho, aby vzorek odebraný z tohoto rámce pokrýval všechny demografické kategorie, které nás zajímají. (Někdy jsou pomocné informace méně explicitní; například telefonní číslo může poskytnout některé informace o poloze.
Vlastnosti vzorkovacího rámečku
Ideální vzorkovací rámec bude mít následující vlastnosti:[1]
- všechny jednotky mají logický číselný identifikátor
- lze najít všechny jednotky - jsou k dispozici jejich kontaktní informace, umístění na mapě nebo jiné relevantní informace
- rámec je organizován logickým a systematickým způsobem
- rámec má další informace o jednotkách, které umožňují použití pokročilejších vzorkovacích rámců
- v rámci je přítomen každý prvek zájmové populace
- každý prvek populace je přítomen pouze jednou v rámu
- v rámci nejsou přítomny žádné prvky mimo zájmovou populaci
- data jsou „aktuální“[4]
Druhy vzorkovacích rámců
Nejpřímějším typem rámce je seznam prvků populace (nejlépe celé populace) s příslušnými kontaktními údaji. Například v průzkum veřejného mínění, možné rámce vzorkování zahrnují volební rejstřík nebo a telefonní seznam. Další rámce vzorkování mohou zahrnovat záznamy o zaměstnání, seznamy školních tříd, spisy pacientů v nemocnici, organizace uvedené v tematické databázi atd.[1][5] Na praktičtějších úrovních mají vzorkovací rámy podobu počítačové soubory.[1]
Ne všechny snímky explicitně uvádějí prvky populace; nějaký seznam pouze „klastrů“. Například a mapa ulic lze použít jako rám pro průzkum od dveří ke dveřím; i když to nezobrazuje jednotlivé domy, můžeme vybrat ulice z mapy a poté vybrat domy na těchto ulicích. To nabízí některé výhody: takový rámec by zahrnoval lidi, kteří se nedávno přestěhovali a ještě nejsou na výše uvedených seznamech rámců, a jeho použití může být jednodušší, protože nevyžaduje ukládání dat pro každou jednotku v populaci, pouze pro menší počet klastrů.
Problémy se vzorkováním rámců
Rámec vzorkování musí být reprezentativní pro populaci, což je otázka mimo rámec statistické teorie vyžadující úsudek odborníků v konkrétním studovaném předmětu. Všechny výše uvedené rámce vynechávají některé lidi, kteří budou hlasovat při příštích volbách, a obsahují některé lidi, kteří nebudou; některé snímky budou obsahovat více záznamů pro stejnou osobu. Lidé, kteří nejsou v rámci, nemají žádnou šanci na odběr vzorků.
Protože rámec založený na klastru obsahuje méně informací o základním souboru, může omezit návrh vzorku, což může vyžadovat použití méně efektivních metod vzorkování a / nebo ztížit interpretaci výsledných dat.
Statistická teorie nám říká o nejistotách při extrapolaci ze vzorku na snímek. Je třeba očekávat, že ukázkové snímky budou vždy obsahovat nějaké chyby.[5] V některých případech to může vést k zkreslení vzorkování.[1] Takové zkreslení by mělo být minimalizováno a identifikováno, i když je v reálném světě jeho úplné vyloučení téměř nemožné.[1] Rovněž by se nemělo předpokládat, že takové jsou zdroje, které tvrdí, že jsou nestranné a reprezentativní.[1]
Při definování rámce je třeba řešit praktické, ekonomické, etické a technické problémy. Potřeba získat včasné výsledky může zabránit rozšíření rámce daleko do budoucnosti. Obtíže mohou být extrémní, pokud jsou populace a rámec disjunktní. To je zvláštní problém v předpovídání kde závěry o budoucnosti vycházejí z historických data. Ve skutečnosti, v roce 1703, kdy Jacob Bernoulli navrhl Gottfried Leibniz možnost použití historických údajů o úmrtnosti k předpovědi pravděpodobnost předčasné smrti živého muže, Gottfried Leibniz rozpoznal problém v odpovědi:[6]
Příroda vytvořila vzorce pocházející z návratu událostí, ale pouze z větší části. Nové nemoci zaplavují lidskou rasu, takže bez ohledu na to, kolik experimentů jste na mrtvolách provedli, neudělali jste tím omezení povahy událostí, aby se v budoucnu nemohly lišit.
— Gottfried Leibniz
Leslie Kish navrhl čtyři základní problémy vzorkovacích rámců:[7]
- Chybějící prvky: Někteří členové populace nejsou do rámečku zahrnuti.
- Cizí prvky: Do rámce jsou zahrnuti nečlenové populace.
- Duplicitní položky: Člen populace je dotazován více než jednou.
- Skupiny nebo klastry: Rámec uvádí seznamy klastrů místo jednotlivců.
Problémy, jako jsou ty uvedené, lze identifikovat pomocí testů před průzkumem a pilotní studie.
Reference
- ^ A b C d E F G h i j Carl-Erik Särndal; Bengt Swensson; Jan Wretman (2003). Vzorkování pomocí modelového průzkumu. Springer. str. 9–12. ISBN 978-0-387-40620-6. Citováno 2. ledna 2011.
- ^ Raymond James Jessen (1978). Techniky statistického zjišťování. Wiley. Citováno 2. ledna 2011.[stránka potřebná ]
- ^ Salant, Priscilla a Don A. Dillman. „Jak provést vlastní průzkum: Přední profesionál vám poskytne osvědčené techniky pro získání spolehlivých výsledků“ (1995)
- ^ Turner, Anthony G. "Vzorkovací rámečky a vzorové vzorky" (PDF). Sekretariát OSN. Citováno 12/11/2012. Zkontrolujte hodnoty data v:
| accessdate =
(Pomoc) - ^ A b Roger Sapsford; Victor Jupp (29. března 2006). Sběr a analýza dat. ŠALVĚJ. str. 28–. ISBN 978-0-7619-4363-1. Citováno 2. ledna 2011.
- ^ Peter L. Bernstein (1998). Proti bohům: pozoruhodný příběh rizika. John Wiley and Sons. str.118 –. ISBN 978-0-471-29563-1. Citováno 2. ledna 2011.
- ^ Leslie Kish (1995). Vzorkování průzkumu. Wiley. ISBN 978-0-471-10949-5. Citováno 11. ledna 2011.[stránka potřebná ]