v statistika, Cochranova věta, vymyslel William G. Cochran,[1] je teorém slouží k ospravedlnění výsledků týkajících se rozdělení pravděpodobnosti statistik, které se používají v analýza rozptylu.[2]
Prohlášení
Předpokládat U1, ..., UN jsou i.i.d. Standard normálně distribuováno náhodné proměnné a existují pozitivní semidefinitní matice
, s
. Dále předpokládejme, že
, kde ri je hodnost z
. Pokud píšeme

takže Qi jsou kvadratické formy, pak Cochranova věta uvádí, že Qi jsou nezávislý a každý Qi má distribuce chí-kvadrát s ri stupně svobody.[1]
Méně formálně je to počet lineárních kombinací zahrnutých do součtu definujících čtverců Qi, za předpokladu, že tyto lineární kombinace jsou lineárně nezávislé.
Důkaz
Nejprve ukážeme, že matice B(i) může být současně diagonalizováno a že jejich nenulová vlastní čísla jsou všechny rovny +1. Poté použijeme vektorový základ které je diagonalizují, aby zjednodušily jejich charakteristická funkce a ukázat jejich nezávislost a distribuci.[3]
Každá z matic B(i) má hodnost ri a tudíž ri nenulový vlastní čísla. Pro každého i, součet
má nanejvýš hodnost
. Od té doby
, z toho vyplývá, že C(i) má přesně hodnost N − ri.
Proto B(i) a C(i) může být současně diagonalizováno. To lze ukázat první diagonalizací B(i). Na tomto základě má formu:

Tedy nižší
řádky jsou nulové. Od té doby
, z toho vyplývá, že tyto řádky v C(i) na tomto základě obsahují pravý blok, který je a
unit matrix, s nulami ve zbytku těchto řádků. Ale od C(i) má hodnost N − ri, jinde to musí být nula. I na tomto základě je tedy diagonální. Z toho vyplývá, že všechny nenulové vlastní čísla oba B(i) a C(i) jsou +1. Výše uvedená analýza může být navíc opakována na diagonálním základě pro
. Na tomto základě
je identita
vektorový prostor, takže z toho vyplývá, že obojí B(2) a
jsou současně diagonalizovatelné v tomto vektorovém prostoru (a tedy také společně s B(1)). Z iterace vyplývá, že vše B- jsou současně diagonalizovatelné.
Existuje tedy ortogonální matice
takové, že pro všechny
,
je úhlopříčka, kde je jakýkoli záznam
s indexy
,
, se rovná 1, zatímco jakýkoli záznam s jinými indexy se rovná 0.
Nechat
označit nějakou konkrétní lineární kombinaci všech
po transformaci
. Všimněte si, že
z důvodu zachování délky ortogonální matice S, že Jacobian lineární transformace je matice spojená s lineární transformací samotnou a že determinant ortogonální matice má modul 1.
Charakteristická funkce Qi je:

To je Fourierova transformace z distribuce chí-kvadrát s ri stupně svobody. Toto je tedy distribuce Qi.
Kromě toho je charakteristická funkce společného rozdělení všech Qis je:

Z toho vyplývá, že všechny Qijsou nezávislé.
Příklady
Průměr vzorku a rozptyl vzorku
Li X1, ..., Xn jsou nezávislé normálně distribuované náhodné proměnné s průměrem μ a směrodatná odchylka σ pak

je standardní normální pro každého i. Všimněte si, že celkem Q se rovná součtu čtverců Us, jak je znázorněno zde:

který vychází z původního předpokladu, že
.Takže místo toho toto množství vypočítáme a později rozdělíme na Qije. Je možné psát

(tady
je průměr vzorku ). Chcete-li zobrazit tuto identitu, vynásobte ji
a všimněte si toho

a rozšířit dávat

Třetí člen je nula, protože se rovná konstantním časům

a druhý termín má právě n shodné pojmy. Tím pádem

a tudíž

Nyní
s
the matice jedniček který má pořadí 1. Na druhé straně
vzhledem k tomu
. Tento výraz lze získat také rozšířením
v maticové notaci. Je možné ukázat, že hodnost
je
protože přidání všech jeho řádků se rovná nule. Tím jsou splněny podmínky pro Cochranovu větu.
Cochranova věta to pak uvádí Q1 a Q2 jsou nezávislé, s distribucí chí-kvadrát s n - 1 a 1 stupeň volnosti. To ukazuje, že vzorek znamená a rozptyl vzorku jsou nezávislé. To může zobrazit také Basuova věta a ve skutečnosti tato vlastnost charakterizuje normální rozdělení - pro žádné jiné rozdělení není průměr vzorku a rozptyl vzorku nezávislý.[4]
Distribuce
Výsledek distribucí je zapsán symbolicky jako


Obě tyto náhodné proměnné jsou úměrné skutečné, ale neznámé odchylce σ2. Jejich poměr tedy nezávisí na σ2 a protože jsou statisticky nezávislé. Rozdělení jejich poměru je dáno vztahem

kde F1,n − 1 je F-distribuce s 1 a n - 1 stupeň volnosti (viz také Studentova t-distribuce ). Posledním krokem je zde efektivně definice náhodné proměnné s F-distribucí.
Odhad rozptylu
Odhadnout rozptyl σ2, jeden odhad, který se někdy používá, je maximální pravděpodobnost odhad rozptylu normálního rozdělení

Cochranova věta to ukazuje

a vlastnosti distribuce chí-kvadrát to ukazují

Alternativní formulace
Následující verze je často vidět při zvažování lineární regrese.[5] Předpokládejme to
je standard vícerozměrný normální náhodný vektor (tady
označuje n-podle-n matice identity ), a pokud
všichni jsou n-podle-n symetrické matice s
. Pak na definování
, některá z následujících podmínek implikuje další dvě:

(tedy
jsou pozitivní semidefinit )
je nezávislý na
pro 
Viz také
Reference