v lineární algebra a teorie matice , Schurův doplněk a bloková matice je definována následovně.
Předpokládat p , q jsou nezáporná celá čísla a předpokládejme A , B , C , D jsou příslušně p × p , p × q , q × p , a q × q matice komplexních čísel. Nechat
M = [ A B C D ] { displaystyle M = left [{ begin {matrix} A&B C&D end {matrix}} right]} aby M je (p + q ) × (p + q ) matice.
Li D je invertibilní, pak Schurův doplněk bloku D matice M je p × p matice definovaná
M / D := A − B D − 1 C . { displaystyle M / D: = A-BD ^ {- 1} C.} Li A je invertibilní, Schurův doplněk bloku A matice M je q × q matice definovaná
M / A := D − C A − 1 B . { displaystyle M / A: = D-CA ^ {- 1} B.} V případě, že A nebo D je jednotné číslo , dosazením a generalizovaná inverze pro inverzní M / A a M / D výnosy zobecněný Schurův doplněk .
Schurův doplněk je pojmenován po Issai Schur kdo to použil k prokázání Schurovo lemma , ačkoli to bylo dříve použito.[1] Emilie Virginia Haynsworthová byl první, kdo to nazval Schurův doplněk .[2] Schurův doplněk je klíčovým nástrojem v oblasti numerické analýzy, statistiky a maticové analýzy.
Pozadí Schurův doplněk vzniká jako výsledek provedení bloku Gaussova eliminace vynásobením matice M zprava s a blok spodní trojúhelníkový matice
L = [ Já p 0 − D − 1 C Já q ] . { displaystyle L = { begin {bmatrix} I_ {p} & 0 - D ^ {- 1} C & I_ {q} end {bmatrix}}.} Tady Jáp označuje a p ×p matice identity . Po násobení maticí L Schurův doplněk se objeví v horní části p ×p blok. Matice produktu je
M L = [ A B C D ] [ Já p 0 − D − 1 C Já q ] = [ A − B D − 1 C B 0 D ] = [ Já p B D − 1 0 Já q ] [ A − B D − 1 C 0 0 D ] . { displaystyle { begin {aligned} ML & = { begin {bmatrix} A&B C&D end {bmatrix}} { begin {bmatrix} I_ {p} & 0 - D ^ {- 1} C & I_ {q } end {bmatrix}} = { begin {bmatrix} A-BD ^ {- 1} C&B 0 & D end {bmatrix}} [4pt] & = { begin {bmatrix} I_ {p} & BD ^ {- 1} 0 & I_ {q} end {bmatrix}} { begin {bmatrix} A-BD ^ {- 1} C & 0 0 & D end {bmatrix}}. End {aligned}}} To je analogické s LDU rozklad . To znamená, že jsme to ukázali
[ A B C D ] = [ Já p B D − 1 0 Já q ] [ A − B D − 1 C 0 0 D ] [ Já p 0 D − 1 C Já q ] , { displaystyle { begin {aligned} { begin {bmatrix} A&B C&D end {bmatrix}} & = { begin {bmatrix} I_ {p} & BD ^ {- 1} 0 & I_ {q} end {bmatrix}} { begin {bmatrix} A-BD ^ {- 1} C & 0 0 & D end {bmatrix}} { begin {bmatrix} I_ {p} & 0 D ^ {- 1} C & I_ { q} end {bmatrix}}, end {zarovnáno}}} a inverzní k M lze tedy vyjádřit zahrnující D −1 a inverze Schurova doplňku (pokud existuje) pouze jako
[ A B C D ] − 1 = [ Já p 0 − D − 1 C Já q ] [ ( A − B D − 1 C ) − 1 0 0 D − 1 ] [ Já p − B D − 1 0 Já q ] = [ ( A − B D − 1 C ) − 1 − ( A − B D − 1 C ) − 1 B D − 1 − D − 1 C ( A − B D − 1 C ) − 1 D − 1 + D − 1 C ( A − B D − 1 C ) − 1 B D − 1 ] = [ ( M / D ) − 1 − ( M / D ) − 1 B D − 1 − D − 1 C ( M / D ) − 1 D − 1 + D − 1 C ( M / D ) − 1 B D − 1 ] . { displaystyle { begin {aligned} & { begin {bmatrix} A&B C&D end {bmatrix}} ^ {- 1} = { begin {bmatrix} I_ {p} & 0 - D ^ {- 1} C & I_ {q} end {bmatrix}} { begin {bmatrix} left (A-BD ^ {- 1} C right) ^ {- 1} & 0 0 & D ^ {- 1} end { bmatrix}} { begin {bmatrix} I_ {p} & - BD ^ {- 1} 0 & I_ {q} end {bmatrix}} [4pt] = {} & { begin {bmatrix} left (A-BD ^ {- 1} C right) ^ {- 1} & - left (A-BD ^ {- 1} C right) ^ {- 1} BD ^ {- 1} - D ^ {- 1} C left (A-BD ^ {- 1} C right) ^ {- 1} & D ^ {- 1} + D ^ {- 1} C left (A-BD ^ {- 1 } C right) ^ {- 1} BD ^ {- 1} end {bmatrix}} [4pt] = {} & { begin {bmatrix} left (M / D right) ^ {- 1 } & - left (M / D right) ^ {- 1} BD ^ {- 1} - D ^ {- 1} C left (M / D right) ^ {- 1} & D ^ { -1} + D ^ {- 1} C left (M / D right) ^ {- 1} BD ^ {- 1} end {bmatrix}}. End {aligned}}} Srov. lema inverze matice který ilustruje vztahy mezi výše uvedeným a ekvivalentní derivací s rolemi A a D zaměnit.
Vlastnosti Li p a q jsou oba 1 (tj. A , B , C a D jsou všechny skaláry), dostaneme známý vzorec pro inverzi matice 2 ku 2: M − 1 = 1 A D − B C [ D − B − C A ] { displaystyle M ^ {- 1} = { frac {1} {AD-BC}} left [{ begin {matrix} D & -B - C&A end {matrix}} right]} pokud INZERÁT − před naším letopočtem je nenulová. Obecně, pokud A je tedy invertibilní M = [ Já p 0 C A − 1 Já q ] [ A 0 0 D − C A − 1 B ] [ Já p A − 1 B 0 Já q ] , M − 1 = [ A − 1 + A − 1 B ( M / A ) − 1 C A − 1 − A − 1 B ( M / A ) − 1 − ( M / A ) − 1 C A − 1 ( M / A ) − 1 ] { displaystyle { begin {aligned} M & = { begin {bmatrix} I_ {p} & 0 CA ^ {- 1} & I_ {q} end {bmatrix}} { begin {bmatrix} A & 0 0 & D -CA ^ {- 1} B end {bmatrix}} { begin {bmatrix} I_ {p} & A ^ {- 1} B 0 & I_ {q} end {bmatrix}}, [4pt] M ^ {- 1} & = { begin {bmatrix} A ^ {- 1} + A ^ {- 1} B (M / A) ^ {- 1} CA ^ {- 1} & - A ^ {- 1 } B (M / A) ^ {- 1} - (M / A) ^ {- 1} CA ^ {- 1} & (M / A) ^ {- 1} end {bmatrix}} end {zarovnaný}}} kdykoli tato inverze existuje. Když A , resp D , je invertibilní, determinant M je také jasně vidět, že je dán det ( M ) = det ( A ) det ( D − C A − 1 B ) { displaystyle det (M) = det (A) det vlevo (D-CA ^ {- 1} B vpravo)} , resp det ( M ) = det ( D ) det ( A − B D − 1 C ) { displaystyle det (M) = det (D) det vlevo (A-BD ^ {- 1} C vpravo)} , který zobecňuje určující vzorec pro matice 2 × 2. (Guttmanův vzorec aditivity) Pokud D je invertibilní, pak hodnost z M darováno hodnost ( M ) = hodnost ( D ) + hodnost ( A − B D − 1 C ) { displaystyle operatorname {rank} (M) = operatorname {rank} (D) + operatorname {rank} left (A-BD ^ {- 1} C right)} (Haynsworthovy setrvačné aditivní vzorce ) Pokud A je invertibilní, pak setrvačnost blokové matice M se rovná setrvačnosti A plus setrvačnost M /A . Aplikace na řešení lineárních rovnic Schurův doplněk přirozeně vzniká při řešení soustavy lineárních rovnic jako např
A X + B y = A C X + D y = b { displaystyle { begin {zarovnáno} Ax + By & = a Cx + Dy & = b end {zarovnáno}}} kde X , A jsou p -dimenzionální vektory sloupců , y , b jsou q -dimenzionální vektory sloupců, A , B , C , D jsou výše uvedené a D je invertibilní. Vynásobení spodní rovnice B D − 1 { textstyle BD ^ {- 1}} a poté odečteme od horní rovnice
( A − B D − 1 C ) X = A − B D − 1 b . { displaystyle left (A-BD ^ {- 1} C right) x = a-BD ^ {- 1} b.} Pokud tedy člověk může invertovat D stejně jako Schurův doplněk D , lze vyřešit X a poté pomocí rovnice C X + D y = b { textstyle Cx + Dy = b} jeden může vyřešit y . To snižuje problém převrácení a ( p + q ) × ( p + q ) { textový styl (p + q) krát (p + q)} matice k matici invertování a p × p matice a q × q matice. V praxi to člověk potřebuje D být dobře podmíněný aby byl tento algoritmus numericky přesný.
V elektrotechnice se to často označuje jako eliminace uzlu nebo Snížení Kron .
Aplikace teorie pravděpodobnosti a statistiky Předpokládejme náhodné vektory sloupců X , Y žít v R n a R m respektive vektor (X , Y ) v R n + m má vícerozměrné normální rozdělení jehož kovariancí je symetrická pozitivně-určitá matice
Σ = [ A B B T C ] , { displaystyle Sigma = left [{ begin {matrix} A&B B ^ { mathsf {T}} & C end {matrix}} right],} kde A ∈ R n × n { textstyle A in mathbb {R} ^ {n krát n}} je kovarianční matice X , C ∈ R m × m { textstyle C in mathbb {R} ^ {m krát m}} je kovarianční matice Y a B ∈ R n × m { textstyle B v mathbb {R} ^ {n krát m}} je kovarianční matice mezi X a Y .
Pak podmíněná kovariance z X daný Y je Schurův doplněk C v Σ { textstyle Sigma} [3] :
Cov ( X ∣ Y ) = A − B C − 1 B T E ( X ∣ Y ) = E ( X ) + B C − 1 ( Y − E ( Y ) ) { displaystyle { begin {aligned} operatorname {Cov} (X mid Y) & = A-BC ^ {- 1} B ^ { mathsf {T}} operatorname {E} (X mid Y) & = operatorname {E} (X) + BC ^ {- 1} (Y- operatorname {E} (Y)) end {zarovnáno}}} Vezmeme-li matici Σ { displaystyle Sigma} výše být ne kovariancí náhodného vektoru, ale a vzorek kovariance, pak může mít a Wishart distribuce . V takovém případě je Schurův doplněk C v Σ { displaystyle Sigma} má také distribuci Wishart.[Citace je zapotřebí ]
Podmínky pro pozitivní definitivnost a semi-definitivnost Nechat X být symetrická matice reálných čísel daná vztahem
X = [ A B B T C ] . { displaystyle X = left [{ begin {matrix} A&B B ^ { mathsf {T}} & C end {matrix}} right].} Pak
Li A je tedy invertibilní X je pozitivní určitý, právě když A a jeho doplněk X / A jsou oba pozitivní definitivní: X ≻ 0 ⇔ A ≻ 0 , X / A = C − B T A − 1 B ≻ 0. { displaystyle X succ 0 Leftrightarrow A succ 0, X / A = C-B ^ { mathsf {T}} A ^ {- 1} B succ 0.} [4] Li C je tedy invertibilní X je pozitivní určitý, právě když C a jeho doplněk X / C. jsou oba pozitivní definitivní: X ≻ 0 ⇔ C ≻ 0 , X / C = A − B C − 1 B T ≻ 0. { displaystyle X succ 0 Leftrightarrow C succ 0, X / C = A-BC ^ {- 1} B ^ { mathsf {T}} succ 0.} Li A je tedy kladně definitivní X je kladný semi-definitivní, právě když je doplňkem X / A je pozitivní semi-definitivní: Li A ≻ 0 , pak X ⪰ 0 ⇔ X / A = C − B T A − 1 B ⪰ 0. { displaystyle { text {If}} A succ 0, { text {then}} X succeq 0 Leftrightarrow X / A = CB ^ { mathsf {T}} A ^ {- 1} B succeq 0.} [5] Li C je tedy kladně definitivní X je kladný semi-definitivní, právě když je doplňkem X / C. je pozitivní semi-definitivní: Li C ≻ 0 , pak X ⪰ 0 ⇔ X / C = A − B C − 1 B T ⪰ 0. { displaystyle { text {If}} C succ 0, { text {then}} X succeq 0 Leftrightarrow X / C = A-BC ^ {- 1} B ^ { mathsf {T}} succeq 0.} Lze odvodit první a třetí příkaz[6] zvážením minimalizátoru množství
u T A u + 2 proti T B T u + proti T C proti , { displaystyle u ^ { mathsf {T}} Au + 2v ^ { mathsf {T}} B ^ { mathsf {T}} u + v ^ { mathsf {T}} Cv, ,} jako funkce proti (pro pevné u ).
Kromě toho od
[ A B B T C ] ≻ 0 ⟺ [ C B T B A ] ≻ 0 { displaystyle left [{ begin {matrix} A&B B ^ { mathsf {T}} & C end {matrix}} right] succ 0 Longleftrightarrow left [{ begin {matrix} C & B ^ { mathsf {T}} B&A end {matrix}} right] succ 0} a podobně pro kladné semitečné matice je druhý (respektive čtvrtý) výrok bezprostřední od prvního (resp. třetího) výroku.
Je zde také dostatečná a nezbytná podmínka pro pozitivní polořadovku X z hlediska zobecněného Schurova doplňku.[1] Přesně,
X ⪰ 0 ⇔ A ⪰ 0 , C − B T A G B ⪰ 0 , ( Já − A A G ) B = 0 { displaystyle X succeq 0 Leftrightarrow A succeq 0, CB ^ { mathsf {T}} A ^ {g} B succeq 0, left (I-AA ^ {g} right) B = 0 ,} a X ⪰ 0 ⇔ C ⪰ 0 , A − B C G B T ⪰ 0 , ( Já − C C G ) B T = 0 , { displaystyle X succeq 0 Leftrightarrow C succeq 0, A-BC ^ {g} B ^ { mathsf {T}} succeq 0, left (I-CC ^ {g} right) B ^ { mathsf {T}} = 0,} kde A G { displaystyle A ^ {g}} označuje generalizovaná inverze z A { displaystyle A} .
Viz také Reference ^ A b Zhang, Fuzhen (2005). Doplněk Schur a jeho aplikace . Springer. doi :10.1007 / b105056 . ISBN 0-387-24271-6 . ^ Haynsworth, E. V., „O doplňku Schur“, Basilejské matematické poznámky , #BNB 20, 17 stran, červen 1968. ^ von Mises, Richard (1964). „Kapitola VIII.9.3“. Matematická teorie pravděpodobnosti a statistika . Akademický tisk. ISBN 978-1483255385 . ^ Zhang, Fuzhen (2005). Doplněk Schur a jeho aplikace . Springer. str. 34. ^ Zhang, Fuzhen (2005). Doplněk Schur a jeho aplikace . Springer. str. 34. ^ Boyd, S. a Vandenberghe, L. (2004), „Konvexní optimalizace“, Cambridge University Press (dodatek A.5.5)