Empirické statistické zákony - Empirical statistical laws

An empirický statistický zákon nebo (v populární terminologii) a zákon statistiky představuje typ chování, který byl nalezen v celé řadě datových sad a skutečně v celé řadě typů datových sad.[1] Mnoho z těchto pozorování bylo formulováno a prokázáno jako statistické nebo pravděpodobnostní věty a termín „zákon“ byl přenesen do těchto vět. Existují i ​​jiné statistické a pravděpodobnostní věty, které mají jako součást svých názvů také „zákon“, které zjevně nevyplývají z empirických pozorování. Oba typy „zákonů“ však lze považovat za případy a vědecké právo v oblasti statistika. To, co odlišuje empirický statistický zákon od formální statistické věty, je způsob, jakým se tyto vzorce jednoduše objevují v přirozených distribucích, bez předchozího teoretického uvažování o datech.

Příklady

Existuje několik takových populárních „statistických zákonů“.

The Paretův princip je oblíbeným příkladem takového „zákona“. Uvádí, že zhruba 80% účinků pochází z 20% příčin, a je tedy známé také jako pravidlo 80/20.[2] V podnikání pravidlo 80/20 říká, že 80% vašeho podnikání pochází pouze z 20% vašich zákazníků.[3] V softwarovém inženýrství se často říká, že 80% chyb je způsobeno pouze 20% chyb.[4] 20% světa vytváří zhruba 80% celosvětového HDP.[5] 80% výdajů na zdravotní péči v USA je způsobeno 20% populace.[6]

Zipfův zákon, popsaný jako "empirický statistický zákon" z lingvistika,[7] je dalším příkladem. Podle „zákona“, vzhledem k určité datové sadě textu, je frekvence slova nepřímo úměrná jeho četnosti. Jinými slovy, druhé nejběžnější slovo by se mělo objevit asi o polovinu častěji než nejběžnější slovo a pátý nejběžnější svět by se objevil asi jednou za pětkrát, než by se objevilo nejběžnější slovo. Co však stanoví Zipfův zákon jako „empirický statistický zákon“ spíše než jen jako lingvistickou větu, je to, že platí i pro jevy mimo jeho obor. Například seřazený seznam amerických metropolitních populací se rovněž řídí Zipfovým zákonem,[8] a dokonce zapomínání následuje Zipfův zákon.[9] Tento akt shrnutí několika přirozených datových vzorců s jednoduchými pravidly je určující charakteristikou těchto „empirických statistických zákonů“.

Příklady empiricky inspirovaných statistických zákonů, které mají pevný teoretický základ, zahrnují:

Mezi příklady „zákonů“ se slabším základem patří:

Příklady „zákonů“, které jsou obecnějšími pozorováními než teoretickým základem:

Příklady domnělých „zákonů“, které jsou nesprávné, zahrnují:

Viz také

Poznámky

  1. ^ Kitcher & Salmon (2009), s. 51
  2. ^ Bunkley, Nick (03.03.2008). „Joseph Juran, 103 let, průkopník v kontrole kvality, umírá“. The New York Times. ISSN  0362-4331. Citováno 2017-05-05.
  3. ^ Zaměstnanci, Investopedia (04.11.2010). „Pravidlo 80–20“. Investopedia. Citováno 2017-05-05.
  4. ^ Rooney, Paula (03.10.2002). „Generální ředitel společnosti Microsoft: Na chyby se vztahuje pravidlo 80–20, nejen funkce“. CRN. Citováno 2017-05-05.
  5. ^ Zpráva o lidském rozvoji z roku 1992. Rozvojový program OSN. New York: Oxford University Press. 1992.CS1 maint: ostatní (odkaz)
  6. ^ „Procento celkových výdajů na zdravotní péči vzniklých různými percentily obyvatel USA: 2002“. Výzkum v akci. Číslo 19: Obrázek 1. Červen 2006.
  7. ^ Gelbukh & Sidorov (2008)
  8. ^ Gabaix, Xavier (2011). „Oblast a populace měst: nové pohledy z jiné perspektivy na města“ (PDF). American Economic Review. sv. 101 (5): 2205–2225. arXiv:1001.5289.
  9. ^ Anderson, John R .; Schooler, Lael J. (listopad 1991). "Odrazy prostředí v paměti" (PDF). Psychologická věda. 2 (6): 396–408. doi:10.1111 / j.1467-9280.1991.tb00174.x. S2CID  8511110.

Reference

  • Kitcher, P., Losos, W.C. (Redaktoři) (2009) Vědecké vysvětlení. University of Minnesota Press. ISBN  978-0-8166-5765-0
  • Gelbukh, A., Sidorov, G. (2008). Koeficienty zákonů Zipf a Heaps závisí na jazyku. V:Výpočetní lingvistika a inteligentní zpracování textu (str. 332–335), Springer. ISBN  978-3-540-41687-6 . odkaz na abstrakt