Twymanův zákon - Twymans law - Wikipedia

Twymanův zákon je zásada, že „čím neobvyklejší nebo zajímavější jsou údaje, tím je pravděpodobnější, že byly výsledkem chyby jakéhokoli druhu“. Je pojmenován po William Anthony Twyman a byl popsán jako jeden z nejdůležitějších zákonů analýza dat.[1][2][3]

Zákon je založen na skutečnosti, že chyby v datech měření a analýza může vést k pozorování množství které se divoce liší od typických hodnot. Tyto chyby jsou obvykle častější než skutečné změny podobné velikosti v základním měřeném procesu. Například pokud analytik v softwarové společnosti zjistí, že počet uživatelů zdvojnásobil přes noc, nejpravděpodobnějším vysvětlením je a Chyba v protokolování, spíše než skutečný nárůst uživatelů.[2]

Zákon lze také rozšířit na situace, kdy jsou podkladová data ovlivněna neočekávanými faktory, které se liší od toho, co mělo být měřeno. Například když školy vykazují neobvykle velká vylepšení v výsledky testu, následné vyšetřování často odhalí, že tato skóre byla způsobena podvod.[4]

Viz také

Reference

  1. ^ Marsh, Catherine; Elliott, Jane. Zkoumání dat. Občanský řád. str. 46. ISBN  978-0-7456-2283-5.
  2. ^ A b Kohavi, Ron; Tang, Diane; Xu, Ya (2020). Důvěryhodné online řízené experimenty: Praktický průvodce testováním A / B. Cambridge University Press. str. 39. ISBN  978-1-108-72426-5.
  3. ^ Ehrenberg, A. S. C .; Twyman, W. A. ​​(1967). „O měření televizního publika“. Journal of the Royal Statistical Society. Řada A (obecně). 130 (1): 1–60. doi:10.2307/2344037. ISSN  0035-9238. JSTOR  2344037.
  4. ^ „Když jsou výsledky testů příliš dobré na to, aby to byla pravda“, Hechingerova zpráva, 2011-03-07