Přípravka - P-rep
tento článek potřebuje další citace pro ověření.Říjen 2011) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
v statistický testování hypotéz, přípravka nebo prep byl navržen jako statistický alternativní ke klasice p-hodnota.[1] Zatímco p-hodnota je pravděpodobnost získání výsledku při nulové hypotéze, p-rep předpokládá výpočet pravděpodobnosti replikace účinku. Odvození p-rep obsahovalo významné matematické chyby.
Na chvíli Sdružení pro psychologickou vědu doporučil, aby články byly zaslány na Psychologická věda a jejich další časopisy uvádějí spíše p-rep než klasickou p-hodnotu,[2] ale toto již neplatí.[3]
Výpočet
Hodnota p-rep (prep) lze aproximovat na základě p-hodnoty (p) jak následuje:
Kritika
Skutečnost, že p-rep má a osobní korespondence s hodnotou p jasně ukazuje, že toto nové opatření nepřináší žádné další informace nad rámec toho, co vyjadřuje význam výsledku. Killeen uznává tento nedostatek informací, ale naznačuje, že p-rep lépe vystihuje cestu naivní experimentátoři pojímají p-hodnoty a statistické testování hypotéz.
Mezi kritiky p-rep patří skutečnost, že zatímco se pokouší odhadnout replikovatelnost, ignoruje výsledky z jiných studií, které mohou tento odhad přesně řídit.[4] Například experiment na nějakém nepravděpodobném paranormálním jevu může přinést p-rep 0,75. Většina lidí by stále nedospěla k závěru, že pravděpodobnost replikace byla 75%. Spíše by dospěli k závěru, že je mnohem blíže k 0: Mimořádná tvrzení vyžadují mimořádné důkazy, a p-rep to ignoruje. Z tohoto důvodu může být p-rep ve skutečnosti těžší interpretovat než klasická p-hodnota. Skutečnost, že p-rep vyžaduje předpoklady o dřívějších pravděpodobnostech, aby byla platná, činí jeho interpretaci složitou. Killeen tvrdí, že nové výsledky by měly být hodnoceny samy o sobě, bez „zátěže historie“, s plochými prioritami: to je to, co p-rep přináší. Pragmatičtější odhad replikovatelnosti by zahrnoval předchozí znalosti, například prostřednictvím metaanalýza.
Kritici také zdůraznili matematické chyby v původním článku Killeen. Například vzorec vztahující se k velikosti efektů ze dvou replikací daného experimentu chybně používá jednu z nich náhodné proměnné jako parametr z rozdělení pravděpodobnosti toho druhého, zatímco dříve předpokládal, že tyto dvě proměnné budou nezávislý,[5] kritika řešená v Killeenově duplice.[6]
Další kritika statistiky p-rep zahrnuje logiku experimentování. Vědecká hodnota replikovatelných dat spočívá v adekvátním účtování dříve neměřených faktorů (např. Neměřené proměnné účastníků, zaujatost experimentátora Myšlenka, že jediná studie může zachytit logickou pravděpodobnost takových neměřených faktorů ovlivňujících výsledek, a tedy pravděpodobnost replikovatelnosti, je logickým klamem.[Citace je zapotřebí ]
Reference
- ^ Killeen PR (2005). „Alternativa k testům významnosti nulové hypotézy“. Psychologická věda. 16 (5): 345–53. doi:10.1111 / j.0956-7976.2005.01538.x. PMC 1473027. PMID 15869691.
- ^ archivovaná verze „Psychological Science Journal, Author Guidelines“
- ^ Psychologický vědecký časopis, Pokyny pro autory.
- ^ Macdonald, R. R. (2005) „Proč pravděpodobnosti replikace závisí na předchozím rozdělení pravděpodobnosti“ Psychologická věda, 2005, 16, 1006–1008 [1][mrtvý odkaz ]
- ^ „p-rep“ ve společnosti Pro Bono Statistics
- ^ Killeen, P. R. (2005) „Replicability, Confidence, and Priors“, Psychologická věda, 2005, 16, 1009–1012 [2]