v statistika, očekávané střední čtverce (EMS) jsou očekávané hodnoty určitých statistik vznikajících v oddílech součtu čtverců v analýza rozptylu (ANOVA). Mohou být použity k určení, která statistika by se měla objevit ve jmenovateli v F-test pro testování a nulová hypotéza že konkrétní účinek chybí.
Definice
Když je celkový opravený součet čtverců v ANOVA rozdělen do několika složek, z nichž každá je přičítána účinku konkrétní predikční proměnné, je každá ze součtů čtverců v tomto rozdělení náhodnou proměnnou, která má očekávaná hodnota. Tato očekávaná hodnota dělená odpovídajícím počtem stupňů volnosti je očekávaná střední čtverec pro tuto predikční proměnnou.
Příklad
Následující příklad pochází z Analýza podélných dat Donald Hedeker a Robert D. Gibbons.[1]
Každý z s léčba (z nichž jednou může být placebo) se podává vzorku (kapitálu) N náhodně vybraní pacienti, u kterých byla provedena určitá měření
jsou pozorovány u každého (malá písmena) n stanovené časy pro
(tedy počty pacientů užívajících různé způsoby léčby se mohou lišit) a
Předpokládáme, že sady pacientů léčených různými způsoby léčby jsou disjunktní, takže pacienti ano vnořené v rámci léčby a není zkřížena s léčbami. My máme

kde

Celkový opravený součet čtverců je

Tabulka ANOVA níže rozděluje součet čtverců (kde
):
![{ displaystyle { begin {pole} {| r | c | l | c | l |} hline { begin {pole} {c} { text {zdroj}} { text {variabilita}} end {pole}} & { begin {pole} {c} { text {stupňů}} { text {svoboda}} end {pole}} & { text {součet čtverců}} & { text {mean square}} & { begin {array} {c} { text {expect}} { text {mean}} { text {square}} end {array}} hline { text {treatment}} & s-1 & { text {SS}} _ { text {Tr}} = n součet _ {h = 1} ^ {s} N_ {h} ({ overline {Y}} _ {h cdot cdot} - { overline {Y}} _ { cdot cdot cdot}) ^ {2} & { dfrac {{ text {SS}} _ { text {Tr}}} {s-1}} & sigma _ { varepsilon} ^ {2} + n sigma _ { pi} ^ {2} + D _ { text {Tr}} [6pt] { text {time}} & n-1 & { text {SS}} _ { text {T}} = N součet _ {j = 1} ^ {n} ({ overline {Y}} _ { cdot cdot j} - { overline {Y}} _ { cdot cdot cdot}) ^ {2} & { dfrac {{ text {SS}} _ { text {T}}} {n -1}} & sigma _ { varepsilon} ^ {2} + D _ { text {T}} [6pt] { text {treatment}} times { text {time}} & (s- 1) (n-1) & { text {SS}} _ { text {Tr T}} = sum _ {h = 1} ^ {s} sum _ {j = 1} ^ {n} N_ {h} ({ overline {Y}} _ {h cdot j} - { overline {Y}} _ {h cdot cdot} - { overline {Y}} _ { cdot cdot j} + { overline { Y}} _ { cdot cdot cdot}) ^ {2} & { dfrac {{ text {SS}} _ { text {Tr T}}} {(n-1) (s-1) }} & sigma _ { varepsilon} ^ {2} + D _ { text {Tr T}} [6pt] { begin {pole} {c} { text {pacienti}} { text {within}} { text {treatment}} end {array}} & N-s & { text {SS}} _ {{ text {S}} ({ text {Tr}})} = n sum _ {h = 1} ^ {s} sum _ {i = 1} ^ {N_ {h}} ({ overline {Y}} _ {hi cdot} - { overline {Y}} _ {h cdot cdot}) ^ {2} & { dfrac {{ text {SS}} _ {{ text {S}} ({ text {Tr}})}} {Ns}} & sigma _ { varepsilon} ^ {2} + n sigma _ { pi} ^ {2} [6pt] { text {chyba}} & (Ns) (n-1) & { text {SS }} _ { text {E}} = sum _ {h = 1} ^ {s} sum _ {i = 1} ^ {N_ {h}} sum _ {j = 1} ^ {n} (Y_ {hij} - { overline {Y}} _ {h cdot j} - { overline {Y}} _ {hi cdot} + { overline {Y}} _ {h cdot cdot} ) ^ {2} & { dfrac {{ text {SS}} _ { text {E}}} {(Ns) (n-1)}} & sigma _ { varepsilon} ^ {2} hline end {pole}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2e224a806106a7cb45683a2bdb9a73dbabec4dcf)
Použití při F-testech
Nulová zajímavá hypotéza je, že neexistuje žádný rozdíl mezi účinky různých léčení - tedy žádný rozdíl mezi léčebnými prostředky. To lze vyjádřit slovy
(se zápisem použitým v tabulce výše). Podle této nulové hypotézy je očekávaný střední kvadrát pro účinky léčby 
Čitatel ve F-statistice pro testování této hypotézy je střední kvadrát kvůli rozdílům mezi léčbami, tj. Je
Jmenovatel však je ne
Důvodem je to, že náhodná proměnná níže, i když podle nulové hypotézy má F-distribuce „není pozorovatelný - nejde o statistiku - protože jeho hodnota závisí na nepozorovatelných parametrech
a 

Místo toho se jako statistika testu použije následující náhodná proměnná, která není definována z hlediska
:

Poznámky a odkazy
- ^ Donald Hedeker, Robert D. Gibbons. Analýza podélných dat. Wiley Interscience. 2006. s. 21–24