v statistika , normální rozdělení matice nebo Gaussovo rozdělení matice je rozdělení pravděpodobnosti to je zobecnění vícerozměrné normální rozdělení na maticové náhodné proměnné.
Definice The funkce hustoty pravděpodobnosti pro náhodnou matici X (n × str ), která následuje po normálním rozdělení matice M N n , str ( M , U , PROTI ) { displaystyle { mathcal {MN}} _ {n, p} ( mathbf {M}, mathbf {U}, mathbf {V})} má formu:
str ( X ∣ M , U , PROTI ) = exp ( − 1 2 t r [ PROTI − 1 ( X − M ) T U − 1 ( X − M ) ] ) ( 2 π ) n str / 2 | PROTI | n / 2 | U | str / 2 { displaystyle p ( mathbf {X} mid mathbf {M}, mathbf {U}, mathbf {V}) = { frac { exp left (- { frac {1} {2} } , mathrm {tr} left [ mathbf {V} ^ {- 1} ( mathbf {X} - mathbf {M}) ^ {T} mathbf {U} ^ {- 1} ( mathbf {X} - mathbf {M}) right] right)} {(2 pi) ^ {np / 2} | mathbf {V} | ^ {n / 2} | mathbf {U} | ^ {p / 2}}}} kde t r { displaystyle mathrm {tr}} označuje stopa a M je n × str , U je n × n a PROTI je str × str .
Normální matice souvisí s vícerozměrné normální rozdělení následujícím způsobem:
X ∼ M N n × str ( M , U , PROTI ) , { displaystyle mathbf {X} sim { mathcal {MN}} _ {n times p} ( mathbf {M}, mathbf {U}, mathbf {V}),} kdyby a jen kdyby
proti E C ( X ) ∼ N n str ( proti E C ( M ) , PROTI ⊗ U ) { displaystyle mathrm {vec} ( mathbf {X}) sim { mathcal {N}} _ {np} ( mathrm {vec} ( mathbf {M}), mathbf {V} otimes mathbf {U})} kde ⊗ { displaystyle otimes} označuje Produkt Kronecker a proti E C ( M ) { displaystyle mathrm {vec} ( mathbf {M})} označuje vektorizace z M { displaystyle mathbf {M}} .
Důkaz Rovnocennost mezi výše uvedeným matice normální a vícerozměrný normální funkce hustoty lze zobrazit pomocí několika vlastností souboru stopa a Produkt Kronecker , jak následuje. Začneme argumentem exponenta maticového normálního PDF:
− 1 2 tr [ PROTI − 1 ( X − M ) T U − 1 ( X − M ) ] = − 1 2 vec ( X − M ) T vec ( U − 1 ( X − M ) PROTI − 1 ) = − 1 2 vec ( X − M ) T ( PROTI − 1 ⊗ U − 1 ) vec ( X − M ) = − 1 2 [ vec ( X ) − vec ( M ) ] T ( PROTI ⊗ U ) − 1 [ vec ( X ) − vec ( M ) ] { displaystyle { begin {aligned} & ; ; ; ; - { frac {1} {2}} { text {tr}} left [ mathbf {V} ^ {- 1} ( mathbf {X} - mathbf {M}) ^ {T} mathbf {U} ^ {- 1} ( mathbf {X} - mathbf {M}) right] & = - { frac {1} {2}} { text {vec}} left ( mathbf {X} - mathbf {M} right) ^ {T} { text {vec}} left ( mathbf {U} ^ {- 1} ( mathbf {X} - mathbf {M}) mathbf {V} ^ {- 1} right) & = - { frac {1} {2}} { text { vec}} left ( mathbf {X} - mathbf {M} right) ^ {T} left ( mathbf {V} ^ {- 1} otimes mathbf {U} ^ {- 1} right) { text {vec}} left ( mathbf {X} - mathbf {M} right) & = - { frac {1} {2}} left [{ text {vec} } ( mathbf {X}) - { text {vec}} ( mathbf {M}) right] ^ {T} left ( mathbf {V} otimes mathbf {U} right) ^ { -1} left [{ text {vec}} ( mathbf {X}) - { text {vec}} ( mathbf {M}) right] end {zarovnáno}}} což je argument exponenta vícerozměrného normálního PDF. Důkaz je dokončen pomocí vlastnosti determinant: | PROTI ⊗ U | = | PROTI | n | U | str . { displaystyle | mathbf {V} otimes mathbf {U} | = | mathbf {V} | ^ {n} | mathbf {U} | ^ {p}.}
Vlastnosti Li X ∼ M N n × str ( M , U , PROTI ) { displaystyle mathbf {X} sim { mathcal {MN}} _ {n times p} ( mathbf {M}, mathbf {U}, mathbf {V})} , pak máme následující vlastnosti:[1] [2]
Očekávané hodnoty Průměr, nebo očekávaná hodnota je:
E [ X ] = M { displaystyle E [ mathbf {X}] = mathbf {M}} a máme následující očekávání druhého řádu:
E [ ( X − M ) ( X − M ) T ] = U tr ( PROTI ) { displaystyle E [( mathbf {X} - mathbf {M}) ( mathbf {X} - mathbf {M}) ^ {T}] = mathbf {U} operatorname {tr} ( mathbf {V})} E [ ( X − M ) T ( X − M ) ] = PROTI tr ( U ) { displaystyle E [( mathbf {X} - mathbf {M}) ^ {T} ( mathbf {X} - mathbf {M})] = mathbf {V} operatorname {tr} ( mathbf {U})} kde tr { displaystyle operatorname {tr}} označuje stopa .
Obecněji pro vhodně dimenzované matice A ,B ,C :
E [ X A X T ] = U tr ( A T PROTI ) + M A M T E [ X T B X ] = PROTI tr ( U B T ) + M T B M E [ X C X ] = PROTI C T U + M C M { displaystyle { begin {aligned} E [ mathbf {X} mathbf {A} mathbf {X} ^ {T}] & = mathbf {U} operatorname {tr} ( mathbf {A} ^ {T} mathbf {V}) + mathbf {MAM} ^ {T} E [ mathbf {X} ^ {T} mathbf {B} mathbf {X}] & = mathbf {V} operatorname {tr} ( mathbf {U} mathbf {B} ^ {T}) + mathbf {M} ^ {T} mathbf {BM} E [ mathbf {X} mathbf {C} mathbf {X}] & = mathbf {V} mathbf {C} ^ {T} mathbf {U} + mathbf {MCM} end {zarovnáno}}} Proměna Přemístit přeměnit:
X T ∼ M N str × n ( M T , PROTI , U ) { displaystyle mathbf {X} ^ {T} sim { mathcal {MN}} _ {p times n} ( mathbf {M} ^ {T}, mathbf {V}, mathbf {U} )} Lineární transformace: let D (r -podle-n ), být plný hodnost r ≤ n a C (str -podle-s ), mít úplnou hodnost s ≤ p , pak:
D X C ∼ M N r × s ( D M C , D U D T , C T PROTI C ) { displaystyle mathbf {DXC} sim { mathcal {MN}} _ {r times s} ( mathbf {DMC}, mathbf {DUD} ^ {T}, mathbf {C} ^ {T} mathbf {VC})} Příklad Představme si vzorek n nezávislý str -dimenzionální náhodné proměnné shodně rozložené podle a vícerozměrné normální rozdělení :
Y i ∼ N str ( μ , Σ ) s i ∈ { 1 , … , n } { displaystyle mathbf {Y} _ {i} sim { mathcal {N}} _ {p} ({ boldsymbol { mu}}, { boldsymbol { Sigma}}) { text {with} } i in {1, ldots, n }} .Při definování n × str matice X { displaystyle mathbf {X}} pro které i Třetí řádek je Y i { displaystyle mathbf {Y} _ {i}} , získáváme:
X ∼ M N n × str ( M , U , PROTI ) { displaystyle mathbf {X} sim { mathcal {MN}} _ {n times p} ( mathbf {M}, mathbf {U}, mathbf {V})} kde každý řádek M { displaystyle mathbf {M}} je rovný μ { displaystyle { boldsymbol { mu}}} , to je M = 1 n × μ T { displaystyle mathbf {M} = mathbf {1} _ {n} krát { boldsymbol { mu}} ^ {T}} , U { displaystyle mathbf {U}} je n × n matice identity, to znamená, že řádky jsou nezávislé, a PROTI = Σ { displaystyle mathbf {V} = { boldsymbol { Sigma}}} .
Odhad parametru maximální věrohodnosti Dáno k matice, každá o velikosti n × str , označeno X 1 , X 2 , … , X k { displaystyle mathbf {X} _ {1}, mathbf {X} _ {2}, ldots, mathbf {X} _ {k}} , u nichž předpokládáme, že byly odebrány vzorky i.i.d. z maticového normálního rozdělení je odhad maximální věrohodnosti parametrů lze získat maximalizací:
∏ i = 1 k M N n × str ( X i ∣ M , U , PROTI ) . { displaystyle prod _ {i = 1} ^ {k} { mathcal {MN}} _ {n times p} ( mathbf {X} _ {i} mid mathbf {M}, mathbf { U}, mathbf {V}).} Řešení pro průměr má uzavřenou formu, a to
M = 1 k ∑ i = 1 k X i { displaystyle mathbf {M} = { frac {1} {k}} součet _ {i = 1} ^ {k} mathbf {X} _ {i}} ale kovarianční parametry ne. Tyto parametry však lze iteračně maximalizovat vynulováním jejich gradientů na:
U = 1 k str ∑ i = 1 k ( X i − M ) PROTI − 1 ( X i − M ) T { displaystyle mathbf {U} = { frac {1} {kp}} součet _ {i = 1} ^ {k} ( mathbf {X} _ {i} - mathbf {M}) mathbf {V} ^ {- 1} ( mathbf {X} _ {i} - mathbf {M}) ^ {T}} a
PROTI = 1 k n ∑ i = 1 k ( X i − M ) T U − 1 ( X i − M ) , { displaystyle mathbf {V} = { frac {1} {kn}} sum _ {i = 1} ^ {k} ( mathbf {X} _ {i} - mathbf {M}) ^ { T} mathbf {U} ^ {- 1} ( mathbf {X} _ {i} - mathbf {M}),} Viz například [3] a odkazy v nich uvedené. Parametry kovariance jsou neidentifikovatelné v tom smyslu, že pro jakýkoli faktor měřítka s> 0 , my máme:
M N n × str ( X ∣ M , U , PROTI ) = M N n × str ( X ∣ M , s U , 1 / s PROTI ) . { displaystyle { mathcal {MN}} _ {n times p} ( mathbf {X} mid mathbf {M}, mathbf {U}, mathbf {V}) = { mathcal {MN} } _ {n times p} ( mathbf {X} mid mathbf {M}, s mathbf {U}, 1 / s mathbf {V}).} Kreslení hodnot z distribuce Odběr vzorků z normálního rozdělení matice je zvláštním případem postupu odběru vzorků pro vícerozměrné normální rozdělení . Nechat X { displaystyle mathbf {X}} být n podle str matice np nezávislé vzorky ze standardního normálního rozdělení, takže
X ∼ M N n × str ( 0 , Já , Já ) . { displaystyle mathbf {X} sim { mathcal {MN}} _ {n times p} ( mathbf {0}, mathbf {I}, mathbf {I}).} Pak nechte
Y = M + A X B , { displaystyle mathbf {Y} = mathbf {M} + mathbf {A} mathbf {X} mathbf {B},} aby
Y ∼ M N n × str ( M , A A T , B T B ) , { displaystyle mathbf {Y} sim { mathcal {MN}} _ {n times p} ( mathbf {M}, mathbf {AA} ^ {T}, mathbf {B} ^ {T} mathbf {B}),} kde A a B lze zvolit pomocí Choleský rozklad nebo podobná operace s druhou odmocninou matice.
Vztah k jiným distribucím Dawid (1981) poskytuje diskusi o vztahu normálního rozdělení s maticovou hodnotou k jiným distribucím, včetně Wishart distribuce , Inverzní distribuce Wishart a maticové t-rozdělení , ale používá jinou notaci, než je zde použitá.
Viz také Reference ^ K Gupta; D K Nagar (22. října 1999). "Kapitola 2: MATRIX ZMĚNĚ NORMÁLNÍ DISTRIBUCE". Maticové proměnné distribuce . CRC Press. ISBN 978-1-58488-046-2 . Citováno 23. května 2014 . ^ Ding, Shanshan; R. Dennis Cook (2014). „ROZMĚROVÁ SKLÁDÁNÍ PCA A PFC PRO PREDIKTORY S HODNOTOU MATIC Statistica Sinica . 24 (1): 463–492. ^ Glanz, Hunter; Carvalho, Luisi. "Algoritmus očekávání-maximalizace pro normální rozdělení matice". arXiv :1309.6609 . Diskrétní univariate s konečnou podporou Diskrétní univariate s nekonečnou podporou Kontinuální univariate podporováno v omezeném intervalu Kontinuální univariate podporováno v poloneomezeném intervalu Kontinuální univariate podporováno na celé reálné linii Kontinuální univariate s podporou, jejíž typ se liší Smíšený spojitý-diskrétní univariate Vícerozměrný (společný) Směrový Degenerovat a jednotné číslo Rodiny