Cayley-Hamiltonova věta - Cayley–Hamilton theorem

Arthur Cayley, F.R.S. (1821–1895) je všeobecně považován za předního britského čistého matematika 19. století. Cayley v roce 1848 odešel do Dublinu na přednášky čtveřice Hamilton, jejich objevitel. Později na něj Cayley zapůsobil tím, že byl druhým, kdo na nich publikoval práci.^[1] Cayley dokázal teorém pro matice dimenze 3 a méně a publikoval důkaz pro dvourozměrný případ.^[2]^[3] Co se týče

n \times n

matice, Cayley uvedl: „... nepovažoval jsem za nutné provést formální důkaz věty v obecném případě matice jakéhokoli stupně“.

William Rowan Hamilton (1805–1865), irský fyzik, astronom a matematik, první zahraniční člen Američana Národní akademie věd. Při zachování protichůdného postavení ohledně toho, jak by měla být geometrie studována, zůstal Hamilton vždy s nejlepšími podmínkami s Cayleym.^[1]

Hamilton dokázal, že pro lineární funkci čtveřice existuje určitá rovnice, v závislosti na lineární funkci, která je splněna samotnou lineární funkcí.^[4]^[5]^[6]

v lineární algebra, Cayley-Hamiltonova věta (pojmenováno podle matematiků Arthur Cayley a William Rowan Hamilton ) uvádí, že každý čtvercová matice přes komutativní prsten (tak jako nemovitý nebo komplex pole ) uspokojuje své vlastní charakteristická rovnice.

Li $A$ je dané $n \times n$ matice a $Já n$ je $n \times n$ matice identity, pak charakteristický polynom z $A$ je definován jako^[7] ${ displaystyle p ( lambda) = det ( lambda I_ {n} -A)}$ , kde $det$ je určující provoz a $λ$ je proměnná pro skalární prvek základního kroužku. Od vstupu do matice ${ displaystyle ( lambda I_ {n} -A)}$ jsou (lineární nebo konstantní) polynomy v $λ$ , determinant je také $n$ -tá objednávka monický polynom v $λ$ ,

{ displaystyle p ( lambda) = lambda ^ {n} + c_ {n-1} lambda ^ {n-1} + cdots + c_ {1} lambda + c_ {0} ~.}

Lze vytvořit analogický polynom

{ displaystyle p (A)}

v matici

A

místo skalární proměnné

λ

, definováno jako

{ displaystyle p (A) = A ^ {n} + c_ {n-1} A ^ {n-1} + cdots + c_ {1} A + c_ {0} I_ {n} ~.}

Cayley-Hamiltonova věta říká, že tento polynom má za následek nulová matice, což znamená

{ displaystyle p (A) = mathbf {0}}

. Věta umožňuje

A

^$n$ být vyjádřena jako lineární kombinace nižších sil matice

A

. Když je prsten pole, Cayley-Hamiltonova věta je ekvivalentní tvrzení, že minimální polynom čtvercové matice rozděluje jeho charakteristický polynom. Věta byla poprvé prokázána v roce 1853^[8] z hlediska inverzí lineárních funkcí čtveřice, a nekomutativní prsten, Hamilton.^[4]^[5]^[6] To odpovídá zvláštnímu případu jistých

4 \times 4

skutečný nebo

2 \times 2

složité matice. Věta platí pro obecné kvaternionové matice.^[9]^{[poznámka 1]} Cayley v roce 1858 to uvedl pro

3 \times 3

a menší matice, ale zveřejnil pouze důkaz pro

2 \times 2

případ.^[2] Obecný případ poprvé prokázal Frobenius v roce 1878.^[10]

Příklady

$1\times1$ matice

Pro $1\times1$ matice $A = (A 1,1)$ , charakteristický polynom je dán vztahem $str (λ) = λ - A$ a tak $str (A) = (A) - A 1,1 = 0$ je triviální.

$2\times2$ matice

Jako konkrétní příklad pojďme

{ displaystyle A = { begin {pmatrix} 1 & 2 3 & 4 end {pmatrix}}.}

Jeho charakteristický polynom je dán vztahem

{ displaystyle p ( lambda) = det ( lambda I_ {2} -A) = det { begin {pmatrix} lambda -1 & -2 - 3 & lambda -4 end {pmatrix}} = ( lambda -1) ( lambda -4) - (- 2) (- 3) = lambda ^ {2} -5 lambda -2.}

Cayley-Hamiltonova věta tvrdí, že pokud ano definovat

{ displaystyle p (X) = X ^ {2} -5X-2I_ {2},}

pak

{ displaystyle p (A) = A ^ {2} -5A-2I_ {2} = { begin {pmatrix} 0 & 0 0 & 0 end {pmatrix}}.}

Můžeme ověřit výpočtem, že skutečně,

{ displaystyle A ^ {2} -5A-2I_ {2} = { begin {pmatrix} 7 a 10 15 & 22 end {pmatrix}} - { begin {pmatrix} 5 & 10 15 & 20 end { pmatrix}} - { begin {pmatrix} 2 & 0 0 & 2 end {pmatrix}} = { begin {pmatrix} 0 & 0 0 & 0 end {pmatrix}}.}

Obecně $2\times2$ matice,

{ displaystyle A = { begin {pmatrix} a & b c & d end {pmatrix}},}

charakteristický polynom je dán vztahem $str (λ) = λ 2 - (A + d) λ + (inzerát - před naším letopočtem)$ , tak to uvádí Cayley-Hamiltonova věta

{ displaystyle p (A) = A ^ {2} - (a + d) A + (ad-bc) I_ {2} = { begin {pmatrix} 0 & 0 0 & 0 end {pmatrix}};}

což je skutečně vždy ten případ, který je evidentní zpracováním záznamů $A$ ².

Aplikace

Determinant a inverzní matice

Pro generála $n \times n$ invertibilní matice $A$ , tj. jeden s nenulovou determinantou, $A$ ⁻¹ lze tedy zapsat jako $(n - 1)$ -th objednat polynomiální výraz v $A$ : Jak je uvedeno, Cayley-Hamiltonova věta odpovídá identitě

${ displaystyle p (A) = A ^ {n} + c_ {n-1} A ^ {n-1} + cdots + c_ {1} A + (- 1) ^ {n} det (A) I_ {n} = O.}$

Koeficienty $C i$ jsou dány elementární symetrické polynomy vlastních čísel $A$ . Použitím Newtonovy identity, elementární symetrické polynomy lze zase vyjádřit pomocí mocninový součet symetrických polynomů vlastních čísel:

{ displaystyle s_ {k} = součet _ {i = 1} ^ {n} lambda _ {i} ^ {k} = operatorname {tr} (A ^ {k}),}

kde $tr (A k)$ je stopa matice $A k$ . Můžeme tedy vyjádřit $C i$ pokud jde o stopu pravomocí $A$ .

Obecně vzorec pro koeficienty $C i$ je uveden v podmínkách úplné exponenciální Polynomy zvonu tak jako ^{[pozn. 2]}

{ displaystyle c_ {nk} = { frac {(-1) ^ {k}} {k!}} B_ {k} (s_ {1}, - 1! s_ {2}, 2! s_ {3} , ldots, (- 1) ^ {k-1} (k-1)! s_ {k}).}

Zejména determinant $A$ rovná se $(-1) n C 0$ . Determinant lze tedy zapsat jako sledovat identitu:

{ displaystyle det (A) = { frac {1} {n!}} B_ {n} (s_ {1}, - 1! s_ {2}, 2! s_ {3}, ldots, (- 1) ^ {n-1} (n-1)! S_ {n}).}

Podobně lze charakteristický polynom zapsat jako

{ displaystyle - (- 1) ^ {n} det (A) I_ {n} = A (A ^ {n-1} + c_ {n-1} A ^ {n-2} + cdots + c_ {1} I_ {n}),}

a vynásobením obou stran číslem $A -1$ (Poznámka $-(-1) n = (-1) n -1$ ), jeden je veden k výrazu pro inverzní k $A$ jako stopová identita,

{ displaystyle { begin {aligned} A ^ {- 1} & = { frac {(-1) ^ {n-1}} { det A}} (A ^ {n-1} + c_ {n -1} A ^ {n-2} + cdots + c_ {1} I_ {n}), [5pt] & = { frac {1} { det A}} sum _ {k = 0 } ^ {n-1} (- 1) ^ {n + k-1} { frac {A ^ {nk-1}} {k!}} B_ {k} (s_ {1}, - 1! s_ {2}, 2! S_ {3}, ldots, (- 1) ^ {k-1} (k-1)! S_ {k}). End {zarovnáno}}}

Další metoda pro získání těchto koeficientů $C k$ pro generála $n \times n$ matice, za předpokladu, že žádný kořen nebude nulový, spoléhá na následující alternativu výraz pro determinant,

{ displaystyle p ( lambda) = det ( lambda I_ {n} -A) = lambda ^ {n} exp ( operatorname {tr} ( log (I_ {n} -A / lambda) )).}

Proto na základě Série Mercator,

{ displaystyle p ( lambda) = lambda ^ {n} exp left (- operatorname {tr} sum _ {m = 1} ^ { infty} {({A over lambda}) ^ {m} přes m} vpravo),}

kde exponenciální pouze je třeba rozšířit na objednávku $λ - n$ , od té doby $str (λ)$ je v pořádku $n$ , čisté záporné síly $λ$ automaticky mizí podle C – H věty. (Opět to vyžaduje prsten obsahující racionální čísla.) Diferenciace tohoto výrazu s ohledem na $λ$ umožňuje obecně vyjádřit koeficienty charakteristického polynomu $n$ jako determinanty $m \times m$ matice,^{[pozn. 3]}

{ displaystyle c_ {nm} = { frac {(-1) ^ {m}} {m!}} { begin {vmatrix} operatorname {tr} A & m-1 & 0 & cdots operatorname {tr} A ^ {2} & operatorname {tr} A & m-2 & cdots vdots & vdots &&& vdots operatorname {tr} A ^ {m-1} & operatorname {tr} A ^ {m- 2} & cdots & cdots & 1 operatorname {tr} A ^ {m} & operatorname {tr} A ^ {m-1} & cdots & cdots & operatorname {tr} A end { vmatrix}} ~.}

Příklady

Například prvních několik polynomů Bell je $B 0$ = 1, $B 1 (X 1) = X 1$ , $B 2 (X 1, X 2) = X 21 + X 2$ , a $B 3 (X 1, X 2, X 3) = X 31 + 3 X 1 X 2 + X 3$ .

Pomocí nich lze určit koeficienty $C i$ charakteristického polynomu a $2\times2$ výnosy matice

{ displaystyle { begin {aligned} c_ {2} = B_ {0} = 1, [4pt] c_ {1} = { frac {-1} {1!}} B_ {1} (s_ { 1}) = - s_ {1} = - operatorname {tr} (A), [4pt] c_ {0} = { frac {1} {2!}} B_ {2} (s_ {1} , -1! S_ {2}) = { frac {1} {2}} (s_ {1} ^ {2} -s_ {2}) = { frac {1} {2}} (( operatorname {tr} (A)) ^ {2} - operatorname {tr} (A ^ {2})). end {zarovnáno}}}

Koeficient $C 0$ dává determinant $2\times2$ matice, $C 1$ minus jeho stopa, zatímco jeho inverzní je dán

{ displaystyle A ^ {- 1} = { frac {-1} { det A}} (A + c_ {1} I_ {2}) = { frac {-2 (A- operatorname {tr} (A) I_ {2})} {( operatorname {tr} (A)) ^ {2} - operatorname {tr} (A ^ {2})}}.}

Je zřejmé z obecného vzorce pro C_n-k, vyjádřeno termíny Bell polynomů, že výrazy

{ displaystyle - operatorname {tr} (A) quad { text {a}} quad { tfrac {1} {2}} ( operatorname {tr} (A) ^ {2} - operatorname { tr} (A ^ {2}))}

vždy dejte koeficienty $C n -1$ z $λ n -1$ a $C n -2$ z $λ n -2$ v charakteristickém polynomu libovolného $n \times n$ matice, resp. Takže pro $3\times3$ matice $A$ , vyjádření Cayley-Hamiltonovy věty lze také napsat jako

{ displaystyle A ^ {3} - ( operatorname {tr} A) A ^ {2} + { frac {1} {2}} left (( operatorname {tr} A) ^ {2} - operatorname {tr} (A ^ {2}) right) A- det (A) I_ {3} = O,}

kde pravá strana označuje a $3\times3$ matice se všemi položkami sníženými na nulu. Stejně tak tento determinant v $n = 3$ případ je nyní

{ displaystyle { begin {aligned} det (A) & = { frac {1} {3!}} B_ {3} (s_ {1}, - 1! s_ {2}, 2! s_ {3 }) = { frac {1} {6}} (s_ {1} ^ {3} + 3s_ {1} (- s_ {2}) + 2s_ {3}) [5pt] & = { tfrac {1} {6}} left (( operatorname {tr} A) ^ {3} -3 operatorname {tr} (A ^ {2}) ( operatorname {tr} A) +2 operatorname {tr } (A ^ {3}) vpravo). End {zarovnáno}}}

Tento výraz dává zápor koeficientu $C n -3$ z $λ n -3$ v obecném případě, jak je vidět níže.

Podobně lze psát pro a $4\times4$ matice $A$ ,

{ displaystyle A ^ {4} - ( operatorname {tr} A) A ^ {3} + { tfrac {1} {2}} { bigl (} ( operatorname {tr} A) ^ {2} - operatorname {tr} (A ^ {2}) { bigr)} A ^ {2} - { tfrac {1} {6}} { bigl (} ( operatorname {tr} A) ^ {3 } -3 operatorname {tr} (A ^ {2}) ( operatorname {tr} A) +2 operatorname {tr} (A ^ {3}) { bigr)} A + det (A) I_ { 4} = O,}

kde je nyní determinant $C n -4$ ,

{ displaystyle { tfrac {1} {24}} left (( operatorname {tr} A) ^ {4} -6 operatorname {tr} (A ^ {2}) ( operatorname {tr} A) ^ {2} +3 ( operatorname {tr} (A ^ {2})) ^ {2} +8 operatorname {tr} (A ^ {3}) operatorname {tr} (A) -6 operatorname {tr} (A ^ {4}) vpravo),}

a tak dále pro větší matice. Stále složitější výrazy pro koeficienty $C k$ je odvoditelný z Newtonovy identity nebo Algoritmus Faddeev – LeVerrier.

n-tá síla matice

Cayley-Hamiltonova věta vždy poskytuje vztah mezi mocnostmi $A$ (i když ne vždy nejjednodušší), což umožňuje zjednodušit výrazy zahrnující takové pravomoci a vyhodnotit je, aniž by bylo nutné vypočítat mocninu $A n$ nebo jakékoli vyšší pravomoci $A$ .

Jako příklad pro ${ displaystyle A = { begin {pmatrix} 1 & 2 3 & 4 end {pmatrix}}}$ věta dává

{ displaystyle A ^ {2} = 5A + 2I_ {2} ,.}

Poté vypočítat $A 4$ , pozorovat

{ displaystyle A ^ {3} = (5A + 2I_ {2}) A = 5A ^ {2} + 2A = 5 (5A + 2I_ {2}) + 2A = 27A + 10I_ {2},}

{ displaystyle A ^ {4} = A ^ {3} A = (27A + 10I_ {2}) A = 27A ^ {2} + 10A = 27 (5A + 2I_ {2}) + 10A = 145A + 54I_ { 2} ,.}

Rovněž,

{ displaystyle A ^ {- 1} = { frac {A-5I_ {2}} {2}} ~.}

Všimněte si, že jsme byli schopni zapsat sílu matice jako součet dvou členů. Ve skutečnosti maticová síla jakéhokoli řádu $k$ lze psát maximálně jako maticový polynom stupně $n - 1$ , kde $n$ je velikost čtvercové matice. Toto je příklad, kdy Cayley-Hamiltonova věta může být použita k vyjádření maticové funkce, o které budeme systematicky diskutovat níže.

Maticové funkce

Vzhledem k analytické funkci

{ displaystyle f (x) = součet _ {k = 0} ^ { infty} a_ {k} x ^ {k}}

a charakteristický polynom $str (X)$ stupně $n$ z $n \times n$ matice $A$ , funkci lze vyjádřit pomocí dlouhého dělení jako

{ displaystyle f (x) = q (x) p (x) + r (x),}

kde $q (X)$ je nějaký kvocient polynomu a $r (X)$ je zbytek polynomu takový, že $0 \leq stupně r (X) < n$ .

Podle Cayley-Hamiltonovy věty, nahrazení $X$ maticí $A$ dává $str (A) = 0$ , takže jeden má

{ displaystyle f (A) = r (A).}

Tedy analytická funkce matice $A$ lze vyjádřit jako maticový polynom stupně menšího než $n$ .

Nechť je zbytek polynom

{ displaystyle r (x) = c_ {0} + c_ {1} x + cdots + c_ {n-1} x ^ {n-1}.}

Od té doby $str (λ) = 0$ , vyhodnocení funkce $F (X)$ na $n$ vlastní čísla $A$ , výnosy

{ displaystyle f ( lambda _ {i}) = r ( lambda _ {i}) = c_ {0} + c_ {1} lambda _ {i} + cdots + c_ {n-1} lambda _ {i} ^ {n-1}, qquad mathrm {for} qquad i = 1,2, ..., n.}

To odpovídá systému $n$ lineární rovnice, které lze řešit za účelem stanovení koeficientů $C i$ . Jeden tedy má

{ displaystyle f (A) = součet _ {k = 0} ^ {n-1} c_ {k} A ^ {k}.}

Když se vlastní čísla opakují, je to $λ i = λ j$ pro některé $já \neq j$ , dvě nebo více rovnic je identických; a proto lineární rovnice nelze vyřešit jednoznačně. V takových případech pro vlastní číslo $λ$ s množstvím $m$ , první $m - 1$ deriváty $p (x)$ zmizet na vlastní hodnotě. To vede k extra $m - 1$ lineárně nezávislá řešení

{ displaystyle { frac { mathrm {d} ^ {k} f (x)} { mathrm {d} x ^ {k}}} { velký |} _ {x = lambda} = { frac { mathrm {d} ^ {k} r (x)} { mathrm {d} x ^ {k}}} { Big |} _ {x = lambda} qquad { text {pro}} qquad k = 1,2, ldots, m-1,}

které v kombinaci s ostatními poskytují požadované $n$ rovnice k řešení $C i$ .

Nalezení polynomu, který prochází body $(λ i, F (λ i))$ je v podstatě problém interpolace a lze jej vyřešit pomocí Lagrange nebo Newtonova interpolace techniky vedoucí k Sylvesterův vzorec.

Předpokládejme například, že úkolem je najít polynomiální reprezentaci

{ displaystyle f (A) = e ^ {At} qquad mathrm {kde} qquad A = { begin {pmatrix} 1 & 2 0 & 3 end {pmatrix}}.}

Charakteristický polynom je $str (X) = (X - 1)(X - 3) = X 2 - 4 X + 3$ a vlastní čísla jsou $λ = 1, 3$ . Nechat $r (X) = C 0 + C 1 X$ . Hodnocení $F (λ) = r (λ)$ na vlastních hodnotách získá člověk dvě lineární rovnice, $E t = C 0 + C 1$ a $E 3 t = C 0 + 3 C 1$ .

Řešení rovnic poskytuje výnosy $C 0 = (3 E t - E 3 t)/2$ a $C 1 = (E 3 t - E t)/2$ . Z toho tedy vyplývá

{ displaystyle e ^ {At} = c_ {0} I_ {2} + c_ {1} A = { begin {pmatrix} c_ {0} + c_ {1} & 2c_ {1} 0 & c_ {0} + 3c_ {1} end {pmatrix}} = { begin {pmatrix} e ^ {t} & e ^ {3t} -e ^ {t} 0 & e ^ {3t} end {pmatrix}}.}

Pokud místo toho byla funkce $F (A) = hřích Na$ , pak by koeficienty byly $C 0 = (3 hříchy t - hřích 3 t)/2$ a $C 1 = (hřích 3 t - hřích t)/2$ ; proto

{ displaystyle sin (At) = c_ {0} I_ {2} + c_ {1} A = { begin {pmatrix} sin t & sin 3t- sin t 0 & sin 3t end {pmatrix }}.}

Jako další příklad při zvažování

{ displaystyle f (A) = e ^ {At} qquad mathrm {kde} qquad A = { begin {pmatrix} 0 & 1 - 1 & 0 end {pmatrix}},}

pak je charakteristický polynom $str (X) = X 2 + 1$ a vlastní čísla jsou $λ = \pm i$ .

Stejně jako dříve nám hodnocení funkce na vlastních číslech dává lineární rovnice $E to = c 0 + i c 1$ a $E - to = C 0 - ic 1$ ; jehož řešení dává, $C 0 = (E to + E - to) / 2 = cos t$ a $C 1 = (E to - E - to)/2 i = hřích t$ . V tomto případě tedy

{ displaystyle e ^ {At} = ( cos t) I_ {2} + ( sin t) A = { begin {pmatrix} cos t & sin t - sin t & cos t end { pmatrix}},}

což je rotační matice.

Standardní příklady takového použití jsou exponenciální mapa z Lež algebra a matice Lieova skupina do skupiny. Je to dáno a exponenciální matice,

{ displaystyle exp: { mathfrak {g}} rightarrow G; qquad tX mapsto e ^ {tX} = sum _ {n = 0} ^ { infty} { frac {t ^ {n} X ^ {n}} {n!}} = I + tX + { frac {t ^ {2} X ^ {2}} {2}} + cdots, t in mathbb {R}, X in { mathfrak {g}}.}

Takové výrazy jsou již dlouho známé $SU (2)$ ,

{ displaystyle e ^ {i ( theta / 2) ({ hat {n}} cdot sigma)} = I_ {2} cos theta / 2 + i ({ hat {n}} cdot sigma) sin theta / 2,}

Kde $σ$ jsou Pauliho matice a pro $SO (3)$ ,

{ displaystyle e ^ {i theta ({ hat {n}} cdot mathbf {J})} = I_ {3} + i ({ hat {n}} cdot mathbf {J}) sin theta + ({ hat {n}} cdot mathbf {J}) ^ {2} ( cos theta -1),}

který je Rodriguesův rotační vzorec. Pro zápis viz rotační skupina SO (3) # Poznámka k Lieově algebře.

V poslední době se výrazy objevily i pro jiné skupiny, například Skupina Lorentz $SO (3, 1)$ ,^[11] $O (4, 2)$ ^[12] a $SU (2, 2)$ ,^[13] stejně jako $GL (n, R)$ .^[14] Skupina $O (4, 2)$ je konformní skupina z vesmírný čas, $SU (2, 2)$ své jednoduše připojeno kryt (abych byl přesný, jednoduše připojený kryt připojená součást $TAK + (4, 2)$ z $O (4, 2)$ ). Získané výrazy platí pro standardní zastoupení těchto skupin. Vyžadují znalosti (některých) z vlastní čísla matice umocnit. Pro $SU (2)$ (a tedy pro $SO (3)$ ), byly získány uzavřené výrazy pro Všechno neredukovatelné reprezentace, tj. jakéhokoli spinu.^[15]

Ferdinand Georg Frobenius (1849–1917), německý matematik. Jeho hlavní zájmy byly eliptické funkce, diferenciální rovnice, a později teorie skupin.
V roce 1878 podal první úplný důkaz Cayley-Hamiltonovy věty.^[10]

Algebraická teorie čísel

Cayley-Hamiltonova věta je efektivní nástroj pro výpočet minimálního polynomu algebraických celých čísel. Například vzhledem k konečnému rozšíření ${ displaystyle mathbb {Q} [ alpha _ {1}, ldots, alpha _ {k}]}$ z ${ displaystyle mathbb {Q}}$ a algebraické celé číslo ${ displaystyle alpha in mathbb {Q} [ alpha _ {1}, ldots, alpha _ {k}]}$ což je nenulová lineární kombinace ${ displaystyle alpha _ {1} ^ {n_ {1}} cdots alpha _ {k} ^ {n_ {k}}}$ můžeme vypočítat minimální polynom z ${ displaystyle alpha}$ vyhledáním matice představující ${ displaystyle mathbb {Q}}$ -lineární transformace

{ displaystyle cdot alpha: mathbb {Q} [ alpha _ {1}, ldots, alpha _ {k}] až mathbb {Q} [ alpha _ {1}, ldots, alfa _ {k}]}

Říkáme tomu transformační matice ${ displaystyle A}$ , pak můžeme najít minimální polynom použitím Cayley-Hamiltonovy věty na ${ displaystyle A}$ .^[16]

Důkazy

Cayley-Hamiltonova věta je bezprostředním důsledkem existence Jordan normální forma pro matice nad algebraicky uzavřená pole. V této části jsou uvedeny přímé důkazy.

Jak ukazují výše uvedené příklady, získání tvrzení Cayley-Hamiltonovy věty pro an $n \times n$ matice

{ displaystyle A = (a_ {ij}) _ {i, j = 1} ^ {n}}

vyžaduje dva kroky: nejprve koeficienty $C i$ charakteristického polynomu jsou určeny vývojem jako polynom v $t$ determinantu

{ displaystyle { begin {zarovnáno} p (t) & = det (tI_ {n} -A) = { begin {vmatrix} t-a_ {1,1} & - a_ {1,2} & cdots & -a_ {1, n} - a_ {2,1} & t-a_ {2,2} & cdots & -a_ {2, n} vdots & vdots & ddots & vdots - a_ {n, 1} & - a_ {n, 2} & cdots & t-a_ {n, n} end {vmatrix}} [5pt] & = t ^ {n} + c_ {n -1} t ^ {n-1} + cdots + c_ {1} t + c_ {0}, end {zarovnáno}}}

a pak jsou tyto koeficienty použity v lineární kombinaci mocnin $A$ to se rovná $n \times n$ nulová matice:

{ displaystyle A ^ {n} + c_ {n-1} A ^ {n-1} + cdots + c_ {1} A + c_ {0} I_ {n} = { begin {pmatrix} 0 & cdots & 0 vdots & ddots & vdots 0 & cdots & 0 end {pmatrix}}.}

Levou stranu lze vypracovat na $n \times n$ matice, jejíž položky jsou (enormní) polynomiální výrazy v sadě položek $A i, j$ z $A$ , takže Cayley-Hamiltonova věta uvádí, že každý z nich $n 2$ výrazy se rovnají $0$ . Pro jakoukoli pevnou hodnotu $n$ , tyto identity lze získat zdlouhavými, ale přímými algebraickými manipulacemi. Žádný z těchto výpočtů však nemůže ukázat, proč by Cayley-Hamiltonova věta měla platit pro matice všech možných velikostí $n$ , takže jednotný důkaz pro všechny $n$ je potřeba.

Předkola

Pokud vektor $proti$ velikosti $n$ je vlastní vektor z $A$ s vlastním číslem $λ$ jinými slovy pokud $A \cdot proti = λv$ , pak

{ displaystyle { begin {zarovnáno} p (A) cdot v & = A ^ {n} cdot v + c_ {n-1} A ^ {n-1} cdot v + cdots + c_ {1} A cdot v + c_ {0} I_ {n} cdot v [6pt] & = lambda ^ {n} v + c_ {n-1} lambda ^ {n-1} v + cdots + c_ { 1} lambda v + c_ {0} v = p ( lambda) v, end {zarovnáno}}}

což je od té doby nulový vektor $str (λ) = 0$ (vlastní čísla $A$ jsou přesně kořeny z $str (t)$ ). To platí pro všechna možná vlastní čísla $λ$ , takže dvě matice, které teorém přirovnal, jistě dávají stejný (nulový) výsledek, když se použijí na jakýkoli vlastní vektor. Teď když $A$ připouští a základ vlastních vektorů, jinými slovy pokud $A$ je úhlopříčně, pak musí platit Cayley-Hamiltonova věta $A$ , protože dvě matice, které dávají stejné hodnoty při použití na každý prvek základny, musí být stejné.

{ displaystyle A = XDX ^ {- 1}, quad D = operatorname {diag} ( lambda _ {i}), quad i = 1,2, ..., n}

{ displaystyle p_ {A} ( lambda) = | lambda I-A | =}

produkt vlastních čísel

{ displaystyle lambda IA ​​= prod _ {i = 1} ^ {n} ( lambda - lambda _ {i}) equiv sum _ {k = 0} ^ {n} c_ {k} lambda ^ {k}}

{ displaystyle p_ {A} (A) = součet c_ {k} A ^ {k} = Xp_ {A} (D) X ^ {- 1} = XCX ^ {- 1}}

{ displaystyle C_ {ii} = součet _ {k = 0} ^ {n} c_ {k} lambda _ {i} ^ {k} = prod _ {j = 1} ^ {n} ( lambda _ {i} - lambda _ {j}) = 0, qquad C_ {i, j neq i} = 0}

{ displaystyle proto p_ {A} (A) = XCX ^ {- 1} = O.}

Zvažte nyní funkci ${ displaystyle e colon M_ {n} až M_ {n}}$ které mapy ${ displaystyle n krát n}$ matice do ${ displaystyle n krát n}$ matice dané vzorcem ${ displaystyle e (A) = p_ {A} (A)}$ , tj. který bere matici ${ displaystyle A}$ a zapojí jej do svého charakteristického polynomu. Ne všechny matice jsou diagonalizovatelné, ale pro matice se složitými koeficienty je mnoho z nich: sada ${ displaystyle D}$ diagonalizovatelné komplexní čtvercové matice dané velikosti je hustý v sadě všech takových čtvercových matic^[17] (aby byla matice diagonalizovatelná, stačí například, že její charakteristický polynom nemá žádné více kořenů). Nyní viděn jako funkce ${ displaystyle e colon mathbb {C} ^ {n ^ {2}} to mathbb {C} ^ {n ^ {2}}}$ (protože matice mají ${ displaystyle n ^ {2}}$ vidíme, že tato funkce je kontinuální. To je pravda, protože položky obrazu matice jsou dány polynomy v položkách matice. Od té doby

${ displaystyle e (D) = left {{ begin {pmatrix} 0 & cdots & 0 vdots & ddots & vdots 0 & cdots & 0 end {pmatrix}} right }}$

a od setu ${ displaystyle D}$ je hustý, tato funkce musí kontinuálně mapovat celou sadu ${ displaystyle n krát n}$ matice na nulovou matici. Proto Cayley-Hamiltonova věta platí pro komplexní čísla, a proto musí také platit pro ${ displaystyle mathbb {Q}}$ - nebo ${ displaystyle mathbb {R}}$ -hodnotové matice.

I když to poskytuje platný důkaz, argument není příliš uspokojivý, protože identity reprezentované teorémem nijak nezávisí na povaze matice (diagonalizovatelné nebo ne), ani na druhu povolených záznamů (pro matice s skutečné položky, diagonalizovatelné, netvoří hustou množinu a zdá se divné, že by bylo nutné zvážit složité matice, aby bylo vidět, že pro ně platí Cayley-Hamiltonova věta). Budeme tedy nyní uvažovat pouze argumenty, které dokážou větu přímo pro jakoukoli matici pouze pomocí algebraických manipulací; mají také tu výhodu, že pracují pro matice se záznamy v libovolném komutativní prsten.

Existuje celá řada takových důkazů Cayley-Hamiltonovy věty, z nichž několik zde bude uvedeno. Liší se množstvím abstraktních algebraických představ potřebných k pochopení důkazu. Nejjednodušší důkazy používají pouze ty pojmy, které jsou potřebné k formulování věty (matice, polynomy s číselnými vstupy, determinanty), ale zahrnují technické výpočty, které poněkud záhadně činí skutečnost, že vedou přesně ke správnému závěru. Je možné se těmto detailům vyhnout, ale za cenu zapojení jemnějších algebraických představ: polynomy s koeficienty v nekomutativním kruhu nebo matice s neobvyklými druhy záznamů.

Spojte matice

Všechny níže uvedené důkazy používají pojem adjugovaná matice $adj (M)$ z $n \times n$ matice $M$ , přemístit jeho kofaktorová matice.

Toto je matice, jejíž koeficienty jsou dány polynomiálními výrazy v koeficientech $M$ (ve skutečnosti jistě $(n - 1)\times(n - 1)$ determinanty) takovým způsobem, že platí následující základní vztahy,

{ displaystyle operatorname {adj} (M) cdot M = det (M) I_ {n} = M cdot operatorname {adj} (M) ~.}

Tyto vztahy jsou přímým důsledkem základních vlastností determinantů: hodnocení $(i, j)$ vstup maticového produktu vlevo dává expanzi po sloupci $j$ determinantu matice získané z $M$ nahrazením sloupce $i$ kopií sloupce $j$ , který je $det (M)$ -li $i = j$ a jinak nula; maticový produkt vpravo je podobný, ale pro rozšíření o řádky.

Jelikož jsou důsledkem manipulace s algebraickými výrazy, jsou tyto vztahy platné pro matice s položkami v jakémkoli komutativním kruhu (pro první definici determinantů je třeba předpokládat komutativitu). To je důležité si uvědomit zde, protože tyto vztahy budou použity níže pro matice s nečíselnými položkami, jako jsou polynomy.

Přímý algebraický důkaz

Tento důkaz používá pouze druh objektů potřebných k formulování Cayley-Hamiltonovy věty: matice s polynomy jako vstupy. Matice $t já n - A$ jehož determinant je charakteristický polynom z $A$ je taková matice, a protože polynomy tvoří komutativní kruh, má doplnit

{ displaystyle B = operatorname {adj} (tI_ {n} -A).}

Pak podle pravého základního vztahu adjugátu jeden má

{ displaystyle (tI_ {n} -A) B = det (tI_ {n} -A) I_ {n} = p (t) I_ {n} ~.}

Od té doby $B$ je také matice s polynomy v $t$ jako položky, jeden může, pro každého $i$ , shromáždit koeficienty $t i$ v každé položce tvoří matici $B i$ čísel, která jeden má

{ displaystyle B = sum _ {i = 0} ^ {n-1} t ^ {i} B_ {i} ~.}

(Způsob zápisu $B$ jsou definovány objasňuje, že žádné síly vyšší než $t n -1$ nastat). Zatímco tohle vzhled jako polynom s maticemi jako koeficienty nebudeme uvažovat o takové představě; je to jen způsob, jak napsat matici s polynomiálními položkami jako lineární kombinaci $n$ konstantní matice a koeficient $t i$ byl napsán nalevo od matice, aby zdůraznil tento úhel pohledu.

Nyní je možné rozšířit maticový produkt v naší rovnici o bilinearitu

{ displaystyle { begin {aligned} p (t) I_ {n} & = (tI_ {n} -A) B & = (tI_ {n} -A) sum _ {i = 0} ^ { n-1} t ^ {i} B_ {i} & = sum _ {i = 0} ^ {n-1} tI_ {n} cdot t ^ {i} B_ {i} - sum _ {i = 0} ^ {n-1} A cdot t ^ {i} B_ {i} & = sum _ {i = 0} ^ {n-1} t ^ {i + 1} B_ { i} - sum _ {i = 0} ^ {n-1} t ^ {i} AB_ {i} & = t ^ {n} B_ {n-1} + sum _ {i = 1} ^ {n-1} t ^ {i} (B_ {i-1} -AB_ {i}) - AB_ {0} ~. end {zarovnáno}}}

Psaní

{ displaystyle p (t) I_ {n} = t ^ {n} I_ {n} + t ^ {n-1} c_ {n-1} I_ {n} + cdots + tc_ {1} I_ {n } + c_ {0} I_ {n} ~,}

jeden získá rovnost dvou matic s polynomiálními zápisy, psaných jako lineární kombinace konstantních matic s mocninami $t$ jako koeficienty.

Taková rovnost může platit pouze v případě, že v jakékoli pozici matice je záznam, který je vynásoben danou mocí $t i$ je stejný na obou stranách; z toho vyplývá, že konstantní matice s koeficientem $t i$ v obou výrazech musí být stejné. Psaní těchto rovnic pak pro $i$ z $n$ až na 0, jeden najde

{ displaystyle B_ {n-1} = I_ {n}, qquad B_ {i-1} -AB_ {i} = c_ {i} I_ {n} quad { text {pro}} 1 leq i leq n-1, qquad -AB_ {0} = c_ {0} I_ {n} ~.}

Nakonec vynásobte rovnici koeficientů $t i$ zleva od $A i$ a shrnout:

${ textstyle A ^ {n} B_ {n-1} + sum limity _ {i = 1} ^ {n-1} left (A ^ {i} B_ {i-1} -A ^ {i +1} B_ {i} right) -AB_ {0} = A ^ {n} + c_ {n-1} A ^ {n-1} + cdots + c_ {1} A + c_ {0} I_ {n} ~.}$

Levé strany tvoří a teleskopická částka a úplně zrušit; pravé strany součet ${ displaystyle p (A)}$ :

{ displaystyle 0 = p (A) ~.}

Tím je důkaz dokončen.

Důkaz využívající polynomy s maticovými koeficienty

Tento důkaz je podobný prvnímu, ale pokouší se dát smysl pojmu polynom s maticovými koeficienty, který byl navržen výrazy vyskytujícími se v tomto důkazu. To vyžaduje značnou péči, protože je poněkud neobvyklé uvažovat polynomy s koeficienty v nekomutativním kruhu a v tomto nastavení nelze použít všechny úvahy platné pro komutativní polynomy.

Je pozoruhodné, že zatímco aritmetika polynomů nad komutativním prstencem modeluje aritmetiku polynomiální funkce, toto není případ nekomutativního kruhu (ve skutečnosti v tomto případě neexistuje zjevný pojem polynomiální funkce, která je uzavřena při násobení). Když tedy uvažujeme polynomy v $t$ s maticovými koeficienty, proměnnou $t$ nesmí být považováno za „neznámé“, ale za formální symbol, se kterým se má zacházet podle daných pravidel; zejména nelze jen nastavit $t$ na konkrétní hodnotu.

{ displaystyle (f + g) (x) = součet _ {i} doleva (f_ {i} + g_ {i} doprava) x ^ {i} = součet _ {i} {f_ {i} x ^ {i}} + sum _ {i} {g_ {i} x ^ {i}} = f (x) + g (x).}

Nechat ${ displaystyle M (n, R)}$ být prstenem ${ displaystyle n krát n}$ matice s položkami v nějakém kruhu R (například reálná nebo komplexní čísla), která má $A$ jako prvek. Matice s polynomy jako koeficienty v $t$ , jako ${ displaystyle tI_ {n} -A}$ nebo jeho adjugát B v prvním důkazu jsou prvky ${ displaystyle M (n, R [t])}$ .

Shromažďováním podobných pravomocí $t$ , takové matice lze psát jako "polynomy" v $t$ s konstantními maticemi jako koeficienty; psát si ${ displaystyle M (n, R) [t]}$ pro množinu takových polynomů. Protože tato sada je v bijection s ${ displaystyle M (n, R [t])}$ , odpovídajícím způsobem definuje aritmetické operace, zejména násobení je dáno

{ displaystyle left ( sum _ {i} M_ {i} t ^ {i} right) left ( sum _ {j} N_ {j} t ^ {j} right) = sum _ { i, j} (M_ {i} N_ {j}) t ^ {i + j},}

respektování pořadí matic koeficientů ze dvou operandů; samozřejmě to dává nekomutativní násobení.

Tedy identita

{ displaystyle (tI_ {n} -A) B = p (t) I_ {n}.}

od prvního důkazu lze nahlížet jako na důkaz zahrnující násobení prvků v ${ displaystyle M (n, R) [t]}$ .

V tomto okamžiku je lákavé jednoduše nastavit $t$ rovná se matici $A$ , což činí první faktor vlevo rovný nulové matici a pravou stranu rovnou $str (A)$ ; to však není povolená operace, když nedojíždí koeficienty. Je možné definovat „mapu vyhodnocení vpravo“ ev_$A$ : M[t] → M, který každý nahrazuje tⁱ výkonem matice $A$ ⁱ z $A$ , kde je stanoveno, že výkon se má vždy vynásobit napravo od příslušného koeficientu.

Tato mapa však není prstencovým homomorfismem: správné hodnocení produktu se obecně liší od produktu správného hodnocení. Je tomu tak proto, že násobení polynomů maticovými koeficienty nemodeluje množení výrazů obsahujících neznámé: produkt ${ displaystyle Mt ^ {i} Nt ^ {j} = (M cdot N) t ^ {i + j}}$ je definován za předpokladu, že $t$ dojíždí s $N$ , ale to může selhat, pokud $t$ je nahrazen maticí $A$ .

Tuto obtíž lze obejít v konkrétní konkrétní situaci, protože výše uvedená mapa hodnocení vpravo se stane prstencovým homomorfismem, pokud je matice $A$ je v centrum prstence koeficientů, takže dojíždí se všemi koeficienty polynomů (argument, který to dokazuje, je přímý, právě proto, že dojíždění $t$ s koeficienty je nyní po vyhodnocení oprávněná).

Nyní, $A$ není vždy uprostřed M, ale můžeme nahradit M s menším prstencem za předpokladu, že obsahuje všechny koeficienty dotyčných polynomů: ${ displaystyle I_ {n}}$ , $A$ a koeficienty ${ displaystyle B_ {i}}$ polynomu B. Zřejmou volbou pro takový podřetězec je centralizátor Z z $A$ , podřetězec všech matic, se kterými dojíždíme $A$ ; podle definice $A$ je ve středu města Z.

Tento centralizátor samozřejmě obsahuje ${ displaystyle I_ {n}}$ , a $A$ , ale je třeba ukázat, že obsahuje matice ${ displaystyle B_ {i}}$ . K tomu je třeba spojit dva základní vztahy pro adjugáty a napsat adjugát B jako polynom:

{ displaystyle { begin {aligned} left ( sum _ {i = 0} ^ {m} B_ {i} t ^ {i} right) (tI_ {n} -A) & = (tI_ {n } -A) sum _ {i = 0} ^ {m} B_ {i} t ^ {i} sum _ {i = 0} ^ {m} B_ {i} t ^ {i + 1} - sum _ {i = 0} ^ {m} B_ {i} At ^ {i} & = sum _ {i = 0} ^ {m} B_ {i} t ^ {i + 1} - sum _ {i = 0} ^ {m} AB_ {i} t ^ {i} sum _ {i = 0} ^ {m} B_ {i} At ^ {i} & = sum _ {i = 0} ^ {m} AB_ {i} t ^ {i}. End {zarovnáno}}}

Rovnání koeficientů ukazuje, že pro každého i, my máme $A$ B_i = B_i $A$ podle přání. Po nalezení správného prostředí, ve kterém ev_$A$ je skutečně homomorfismus prstenů, lze dokončit důkaz, jak je navrženo výše:

{ displaystyle { begin {aligned} operatorname {ev} _ {A} { bigl (} p (t) I_ {n} { bigr)} & = operatorname {ev} _ {A} ((tI_ {n} -A) B) [5pt] p (A) & = operatorname {ev} _ {A} (tI_ {n} -A) cdot operatorname {ev} _ {A} (B) [5pt] p (A) & = (AI_ {n} -A) cdot operatorname {ev} _ {A} (B) = O cdot operatorname {ev} _ {A} (B) = O. end {zarovnáno}}}

Tím je důkaz dokončen.

Syntéza prvních dvou důkazů

V prvním důkazu bylo možné určit koeficienty $B i$ z $B$ založeno pouze na pravém základním vztahu pro adjugát. Vlastně první $n$ odvozené rovnice lze interpretovat jako určení kvocientu $B$ z Euklidovské dělení polynomu $str (t) Já n$ nalevo u monický polynom $Já n t - A$ , zatímco konečná rovnice vyjadřuje skutečnost, že zbytek je nula. Toto dělení se provádí v kruhu polynomů s maticovými koeficienty. Opravdu, dokonce přes non-komutativní prsten, euklidovské dělení monickým polynomem $P$ je definován a vždy vytvoří jedinečný kvocient a zbytek se stejnou podmínkou stupně jako v komutativním případě, za předpokladu, že je uvedeno, na které straně si přejete $P$ být faktorem (zde vlevo).

Chcete-li vidět, že kvocient a zbytek jsou jedinečné (což je zde důležitá část prohlášení), stačí napsat ${ displaystyle PQ + r = PQ '+ r'}$ tak jako ${ displaystyle P (Q-Q ') = r'-r}$ a pozorujte to od té doby $P$ je monický $P (Q-Q ')$ nemůže mít titul menší než $P$ , pokud $Q = Q '$ .

Ale dividenda $str (t) Já n$ a dělitel $Já n t - A$ zde použité oba leží v podřetězci $(R [A])[t]$ , kde $R [A]$ je podřetězec maticového kruhu $M (n, R)$ generováno uživatelem $A$ : $R$ -lineární rozpětí všech sil $A$ . Proto lze euklidovské dělení ve skutečnosti provádět v rámci toho komutativní polynomiální kruh, a ten pak samozřejmě dává stejný podíl $B$ a zbytek 0 jako ve větším kruhu; zejména to ukazuje $B$ ve skutečnosti spočívá v $(R [A])[t]$ .

Ale v tomto komutativním nastavení je platné nastavit $t$ na $A$ v rovnici

{ displaystyle p (t) I_ {n} = (tI_ {n} -A) B;}

jinými slovy, použít hodnotící mapu

{ displaystyle operatorname {ev} _ {A} :( R [A]) [t] do R [A]}

což je kruhový homomorfismus, dávající

{ displaystyle p (A) = 0 cdot operatorname {ev} _ {A} (B) = 0}

stejně jako v druhém důkazu, jak bylo požadováno.

Kromě prokázání věty nám výše uvedený argument říká, že koeficienty $B i$ z $B$ jsou polynomy v $A$ , zatímco z druhého důkazu jsme věděli jen to, že leží v centralizátoru $Z$ z $A$ ; obecně $Z$ je větší podřetězec než $R [A]$ , a nemusí být nutně komutativní. Zejména konstantní termín $B 0 = adj (- A)$ leží v $R [A]$ . Od té doby $A$ je libovolná čtvercová matice, to dokazuje $adj (A)$ lze vždy vyjádřit jako polynom v $A$ (s koeficienty, které závisí na $A)$ .

Ve skutečnosti rovnice nalezené v prvním důkazu umožňují postupné vyjádření ${ displaystyle B_ {n-1}, ldots, B_ {1}, B_ {0}}$ jako polynomy v $A$ , což vede k identitě

${ displaystyle operatorname {adj} (-A) = součet _ {i = 1} ^ {n} c_ {i} A ^ {i-1},}$

platí pro všechny $n \times n$ matice, kde

{ displaystyle p (t) = t ^ {n} + c_ {n-1} t ^ {n-1} + cdots + c_ {1} t + c_ {0}}

je charakteristický polynom z $A$ .

Všimněte si, že tato identita také implikuje tvrzení Cayley-Hamiltonovy věty: jeden se může pohybovat $adj (- A)$ na pravé straně vynásobte výslednou rovnici (vlevo nebo vpravo) číslem $A$ a využij toho, že

{ displaystyle -A cdot operatorname {adj} (-A) = operatorname {adj} (-A) cdot (-A) = det (-A) I_ {n} = c_ {0} I_ { n}.}

Důkaz využívající matice endomorfismů

Jak již bylo zmíněno výše, matice str(A) ve výroku věty se získá tak, že se nejprve vyhodnotí determinant a poté se dosadí matice A pro t; dělá tuto substituci do matice ${ displaystyle tI_ {n} -A}$ před hodnocením determinantu nemá smysl. Je však možné podat výklad, kde str(A) se získá přímo jako hodnota určitého determinantu, vyžaduje to však složitější nastavení, jednu z matic přes prsten, ve kterém lze interpretovat obě položky ${ displaystyle A_ {i, j}}$ z Aa všechny A sám. Dalo by se vzít za to prsten M(n, R) z n×n matice přes R, kde je položka ${ displaystyle A_ {i, j}}$ je realizován jako ${ displaystyle A_ {i, j} I_ {n}}$ , a A jako sám. Ale považování matic s maticemi za položky může způsobit záměnu s blokové matice, což není zamýšleno, protože to dává nesprávný pojem determinantu (připomeňme, že determinant matice je definován jako součet produktů jejích položek, a v případě blokové matice to obecně není totéž jako odpovídající součet produktů jejích bloků!). Je jasnější rozlišovat A z endomorfismu φ z n-dimenzionální vektorový prostor PROTI (nebo zdarma R-modul, pokud R není pole) definované na základě ${ displaystyle e_ {1}, ldots, e_ {n}}$ , a vzít matice přes kruh Konec (PROTI) všech těchto endomorfismů. Pak φ ∈ Konec (PROTI) je možný záznam matice, zatímco A označuje prvek M(n, Konec(PROTI)) jehož i,j entry is endomorphism of scalar multiplication by ${ displaystyle A_ {i, j}}$ ; podobně ${ displaystyle I_ {n}}$ will be interpreted as element of M(n, End(PROTI)). However, since End(PROTI) is not a commutative ring, no determinant is defined on M(n, End(PROTI)); this can only be done for matrices over a commutative subring of End(PROTI). Now the entries of the matrix ${displaystyle varphi I_{n}-A}$ all lie in the subring R[φ] generated by the identity and φ, což je komutativní. Then a determinant map M(n, R[φ]) → R[φ] is defined, and ${displaystyle det(varphi I_{n}-A)}$ evaluates to the value str(φ) of the characteristic polynomial of A na φ (this holds independently of the relation between A a φ); the Cayley–Hamilton theorem states that str(φ) is the null endomorphism.

In this form, the following proof can be obtained from that of (Atiyah & MacDonald 1969, Prop. 2.4) (which in fact is the more general statement related to the Nakayama lemma; one takes for the ideal in that proposition the whole ring R). Skutečnost, že A is the matrix of φ v základu E₁, ..., E_n znamená, že

{displaystyle varphi (e_{i})=sum _{j=1}^{n}A_{j,i}e_{j}quad { ext{for }}i=1,ldots ,n.}

One can interpret these as n components of one equation in PROTIⁿ, whose members can be written using the matrix-vector product M(n, End(PROTI)) × PROTIⁿ → PROTIⁿ that is defined as usual, but with individual entries ψ ∈ End(PROTI) a proti v PROTI being "multiplied" by forming ${displaystyle psi (v)}$ ; this gives:

{displaystyle varphi I_{n}cdot E=A^{operatorname {tr} }cdot E,}

kde ${displaystyle Ein V^{n}}$ is the element whose component i je E_i (in other words it is the basis E₁, ..., E_n z PROTI written as a column of vectors). Writing this equation as

{displaystyle (varphi I_{n}-A^{operatorname {tr} })cdot E=0in V^{n}}

one recognizes the přemístit matice ${displaystyle varphi I_{n}-A}$ considered above, and its determinant (as element of M(n, R[φ])) is also str(φ). To derive from this equation that str(φ) = 0 ∈ End(PROTI), one left-multiplies by the adjugate matrix z ${displaystyle varphi I_{n}-A^{operatorname {tr} }}$ , which is defined in the matrix ring M(n, R[φ]), giving

{displaystyle {egin{aligned}0&=operatorname {adj} (varphi I_{n}-A^{operatorname {tr} })cdot ((varphi I_{n}-A^{operatorname {tr} })cdot E)&=(operatorname {adj} (varphi I_{n}-A^{operatorname {tr} })cdot (varphi I_{n}-A^{operatorname {tr} }))cdot E&=(det(varphi I_{n}-A^{operatorname {tr} })I_{n})cdot E&=(p(varphi )I_{n})cdot E;end{aligned}}}

the associativity of matrix-matrix and matrix-vector multiplication used in the first step is a purely formal property of those operations, independent of the nature of the entries. Now component i of this equation says that str(φ)(E_i) = 0 ∈ PROTI; tím pádem str(φ) vanishes on all E_i, and since these elements generate PROTI z toho vyplývá, že str(φ) = 0 ∈ End(PROTI), completing the proof.

One additional fact that follows from this proof is that the matrix A whose characteristic polynomial is taken need not be identical to the value φ substituted into that polynomial; it suffices that φ be an endomorphism of PROTI satisfying the initial equations

{displaystyle varphi (e_{i})=sum _{j}A_{j,i}e_{j}}

pro nějaký sled prvků E₁,...,E_n které generují PROTI (which space might have smaller dimension than n, or in case the ring R is not a field it might not be a bezplatný modul at all).

A bogus "proof": str(A) = det(AI_n − A) = det(A − A) = 0

One persistent elementary but nesprávný argument^[18] for the theorem is to "simply" take the definition

{ displaystyle p ( lambda) = det ( lambda I_ {n} -A)}

a nahradit $A$ pro $λ$ , získávání

{displaystyle p(A)=det(AI_{n}-A)=det(A-A)=0~.}

There are many ways to see why this argument is wrong. First, in Cayley–Hamilton theorem, str(A) je n×n matrix. However, the right hand side of the above equation is the value of a determinant, which is a skalární. So they cannot be equated unless n = 1 (i.e. A is just a scalar). Second, in the expression ${displaystyle det(lambda I_{n}-A)}$ , the variable λ actually occurs at the diagonal entries of the matrix ${displaystyle lambda I_{n}-A}$ . To illustrate, consider the characteristic polynomial in the previous example again:

{displaystyle det {egin{pmatrix}lambda -1&-2-3&lambda -4end{pmatrix}}.}

If one substitutes the entire matrix A pro λ in those positions, one obtains

{displaystyle det {egin{pmatrix}{egin{pmatrix}1&23&4end{pmatrix}}-1&-2-3&{egin{pmatrix}1&23&4end{pmatrix}}-4end{pmatrix}},}

in which the "matrix" expression is simply not a valid one. Note, however, that if scalar multiples of identity matricesinstead of scalars are subtracted in the above, i.e. if the substitution is performed as

{displaystyle det {egin{pmatrix}{egin{pmatrix}1&23&4end{pmatrix}}-I_{2}&-2I_{2}-3I_{2}&{egin{pmatrix}1&23&4end{pmatrix}}-4I_{2}end{pmatrix}},}

then the determinant is indeed zero, but the expanded matrix in question does not evaluate to ${displaystyle AI_{n}-A}$ ; nor can its determinant (a scalar) be compared to str(A) (a matrix). So the argument that ${displaystyle p(A)=det(AI_{n}-A)=0}$ still does not apply.

Actually, if such an argument holds, it should also hold when other multilinear forms instead of determinant is used. For instance, if we consider the trvalý function and define ${displaystyle q(lambda )=operatorname {perm} (lambda I_{n}-A)}$ , then by the same argument, we should be able to "prove" that q(A) = 0. But this statement is demonstrably wrong. In the 2-dimensional case, for instance, the permanent of a matrix is given by

{displaystyle operatorname {perm} {egin{pmatrix}a&bc&dend{pmatrix}}=ad+bc.}

So, for the matrix A in the previous example,

{displaystyle {egin{aligned}q(lambda )&=operatorname {perm} (lambda I_{2}-A)=operatorname {perm} {egin{pmatrix}lambda -1&-2-3&lambda -4end{pmatrix}}[6pt]&=(lambda -1)(lambda -4)+(-2)(-3)=lambda ^{2}-5lambda +10.end{aligned}}}

Yet one can verify that

{displaystyle q(A)=A^{2}-5A+10I_{2}=12I_{2} ot =0.}

One of the proofs for Cayley–Hamilton theorem above bears some similarity to the argument that ${displaystyle p(A)=det(AI_{n}-A)=0}$ . By introducing a matrix with non-numeric coefficients, one can actually let A live inside a matrix entry, but then ${displaystyle AI_{n}}$ se nerovná A, and the conclusion is reached differently.

Proofs using methods of abstract algebra

Basic properties of Hasse–Schmidt derivations na vnější algebra ${displaystyle A=igwedge M}$ některých B-modul M (supposed to be free and of finite rank) have been used by Gatto & Salehyan (2016, §4) to prove the Cayley–Hamilton theorem. Viz také Gatto & Scherbak (2015).

Abstraction and generalizations

The above proofs show that the Cayley–Hamilton theorem holds for matrices with entries in any commutative ring R, a to str(φ) = 0 will hold whenever φ is an endomorphism of an R module generated by elements E₁,...,E_n to uspokojuje

{displaystyle varphi (e_{j})=sum a_{ij}e_{i},qquad j=1,ldots ,n.}

This more general version of the theorem is the source of the celebrated Nakayama lemma in commutative algebra and algebraic geometry.

Viz také

Doprovodná matice

Poznámky

^ Due to the non-commutative nature of the multiplication operation for quaternions and related constructions, care needs to be taken with definitions, most notably in this context, for the determinant. The theorem holds as well for the slightly less well-behaved rozdělené čtveřice viz Alagös, Oral & Yüce (2012). The rings of quaternions and split-quaternions can both be represented by certain $2 \times 2$ složité matice. (When restricted to unit norm, these are the groups $SU (2)$ a $SU(1, 1)$ respectively.) Therefore it is not surprising that the theorem holds.
There is no such matrix representation for the octonions, since the multiplication operation is not associative in this case. However, a modified Cayley–Hamilton theorem still holds for the octonions, see Tian (2000).
^ An explicit expression for these coefficients is
${displaystyle c_{i}=sum _{k_{1},k_{2},ldots ,k_{n}}prod _{l=1}^{n}{frac {(-1)^{k_{l}+1}}{l^{k_{l}}k_{l}!}}operatorname {tr} (A^{l})^{k_{l}},}$
where the sum is taken over the sets of all integer partitions $k l \geq 0$ splnění rovnice
${displaystyle sum _{l=1}^{n}lk_{l}=n-i.}$
^ Viz např. Str. 54 of Brown 1994, which solves Jacobiho vzorec,
${displaystyle partial p(lambda )/partial lambda =p(lambda )sum _{m=0}^{infty }lambda ^{-(m+1)}operatorname {tr} A^{m}=p(lambda )~operatorname {tr} {frac {I}{lambda I-A}}equiv operatorname {tr} B~,}$
kde $B$ is the adjugate matrix of the next section.There also exists an equivalent, related recursive algorithm introduced by Urbain Le Verrier a Dmitrij Konstantinovič Faddeev —The Algoritmus Faddeev – LeVerrier, který čte
${displaystyle {egin{aligned}M_{0}&equiv O&c_{n}&=1qquad &(k=0)[5pt]M_{k}&equiv AM_{k-1}-{frac {1}{k-1}}(operatorname {tr} (AM_{k-1}))Iqquad qquad &c_{n-k}&=-{frac {1}{k}}operatorname {tr} (AM_{k})qquad &k=1,ldots ,n~.end{aligned}}}$
(see, e.g., p 88 of Gantmacher 1960.) Observe $A -1 = - M n / C 0$ as the recursion terminates.See the algebraic proof in the following section, which relies on the modes of the adjugate, $B k \equiv M n - k$ . Konkrétně ${displaystyle (lambda I-A)B=Ip(lambda )}$ and the above derivative of $str$ when one traces it yields
${displaystyle lambda p'-np=operatorname {tr} (AB)~,}$ (Hou 1998 ), and the above recursions, in turn.

Poznámky

^ ^A ^b Crilly 1998
^ ^A ^b Cayley 1858, pp. 17–37
^ Cayley 1889, pp. 475–496
^ ^A ^b Hamilton 1864a
^ ^A ^b Hamilton 1864b
^ ^A ^b Hamilton 1862
^ Atiyah & MacDonald 1969
^ Hamilton 1853, str. 562
^ Zhang 1997
^ ^A ^b Frobenius 1878
^ Zeni & Rodrigues 1992
^ Barut, Zeni & Laufer 1994a
^ Barut, Zeni & Laufer 1994b
^ Laufer 1997
^ Curtright, Fairlie & Zachos 2014
^ Stein, William. Algebraic Number Theory, a Computational Approach (PDF). p. 29.
^ Bhatia 1997, str. 7
^ Garrett 2007, str. 381

Reference

Alagös, Y.; Oral, K.; Yüce, S. (2012). "Split Quaternion Matrices". Miskolc Mathematical Notes. 13 (2): 223–232. doi:10.18514/MMN.2012.364. ISSN 1787-2405CS1 maint: ref = harv (odkaz) (otevřený přístup)
Atiyah, M. F.; MacDonald, I. G. (1969), Úvod do komutativní algebry, Westview Press, ISBN 978-0-201-40751-8
Barut, A. O.; Zeni, J. R.; Laufer, A. (1994a). "The exponential map for the conformal group O(2,4)". J. Phys. A: Math. Gen. 27 (15): 5239–5250. arXiv:hep-th/9408105. Bibcode:1994JPhA...27.5239B. doi:10.1088/0305-4470/27/15/022.CS1 maint: ref = harv (odkaz)
Barut, A. O.; Zeni, J. R.; Laufer, A. (1994b). "The exponential map for the unitary group SU(2,2)". J. Phys. A: Math. Gen. 27 (20): 6799–6806. arXiv:hep-th/9408145. Bibcode:1994JPhA...27.6799B. doi:10.1088/0305-4470/27/20/017.CS1 maint: ref = harv (odkaz)
Bhatia, R. (1997). Maticová analýza. Maturitní texty z matematiky. 169. Springer. ISBN 978-0387948461.CS1 maint: ref = harv (odkaz)
Brown, Lowell S. (1994). Teorie kvantového pole. Cambridge University Press. ISBN 978-0-521-46946-3.CS1 maint: ref = harv (odkaz)
Cayley, A. (1858). "A Memoir on the Theory of Matrices". Philos. Trans. 148.CS1 maint: ref = harv (odkaz)
Cayley, A. (1889). The Collected Mathematical Papers of Arthur Cayley. (Classic Reprint). 2. Zapomenuté knihy. JAKO V B008HUED9O.CS1 maint: ref = harv (odkaz)
Crilly, T. (1998). "The young Arthur Cayley". Poznámky Rec. R. Soc. Lond. 52 (2): 267–282. doi:10.1098/rsnr.1998.0050.CS1 maint: ref = harv (odkaz)
Curtright, T L; Fairlie, D B; Zachos, C K (2014). "Kompaktní vzorec pro rotace jako polynomy spinové matice". SIGMA. 10 (2014): 084. arXiv:1402.3541. Bibcode:2014SIGMA..10..084C. doi:10.3842 / SIGMA.2014.084.CS1 maint: ref = harv (odkaz)
Frobenius, G. (1878). "Ueber lineare Substutionen und bilineare Formen". J. Reine Angew. Matematika. 1878 (84): 1–63. doi:10.1515/crll.1878.84.1.CS1 maint: ref = harv (odkaz)
Gantmacher, F.R. (1960). Teorie matic. NY: Chelsea Publishing. ISBN 978-0-8218-1376-8.CS1 maint: ref = harv (odkaz)
Gatto, Letterio; Salehyan, Parham (2016), Hasse–Schmidt derivations on Grassmann algebrasSpringer, doi:10.1007/978-3-319-31842-4, ISBN 978-3-319-31842-4, PAN 3524604
Gatto, Letterio; Scherbak, Inna (2015), Remarks on the Cayley-Hamilton Theorem, arXiv:1510.03022
Garrett, Paul B. (2007). Abstraktní algebra. NY: Chapman and Hall/CRC. ISBN 978-1584886891.CS1 maint: ref = harv (odkaz)
Hamilton, W. R. (1853). Přednášky o čtveřicích. Dublin.CS1 maint: ref = harv (odkaz)
Hamilton, W. R. (1864a). "On a New and General Method of Inverting a Linear and Quaternion Function of a Quaternion". Sborník Královské irské akademie. viii: 182–183.CS1 maint: ref = harv (odkaz) (communicated on June 9, 1862)
Hamilton, W. R. (1864b). "On the Existence of a Symbolic and Biquadratic Equation, which is satisfied by the Symbol of Linear Operation in Quaternions". Sborník Královské irské akademie. viii: 190–101.CS1 maint: ref = harv (odkaz) (communicated on June 23, 1862)
Hou, S. H. (1998). "Classroom Note: A Simple Proof of the Leverrier--Faddeev Characteristic Polynomial Algorithm". Recenze SIAM. 40 (3): 706–709. Bibcode:1998SIAMR..40..706H. doi:10.1137 / S003614459732076X.CS1 maint: ref = harv (odkaz) „Poznámka k učebně: Jednoduchý důkaz Leverriera - Faddeevův charakteristický polynomiální algoritmus“
Hamilton, W. R. (1862). „O existenci symbolické a bikvadratické rovnice, kterou splňuje Symbol lineární nebo distribuční operace na čtveřici“. The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science. série iv. 24: 127–128. ISSN 1478-6435. Citováno 2015-02-14.CS1 maint: ref = harv (odkaz)
Majitel domácnosti, Alston S. (2006). Teorie matic v numerické analýze. Dover knihy o matematice. ISBN 978-0486449722.CS1 maint: ref = harv (odkaz)
Laufer, A. (1997). Msgstr "Exponenciální mapa GL (N)". J. Phys. A: Math. Gen. 30 (15): 5455–5470. arXiv:hep-th / 9604049. Bibcode:1997JPhA ... 30.5455L. doi:10.1088/0305-4470/30/15/029.CS1 maint: ref = harv (odkaz)
Tian, Y. (2000). Msgstr "Maticové reprezentace oktonionů a jejich aplikace". Pokroky v aplikované Cliffordské algebře. 10 (1): 61–90. arXiv:matematika / 0003166. CiteSeerX 10.1.1.237.2217. doi:10.1007 / BF03042010. ISSN 0188-7009.CS1 maint: ref = harv (odkaz)
Zeni, J. R .; Rodrigues, W.A. (1992). „Promyšlená studie Lorentzových transformací Cliffordových algeber“. Int. J. Mod. Phys. A. 7 (8): 1793 stran Bibcode:1992 IJMPA ... 7.1793Z. doi:10.1142 / S0217751X92000776.CS1 maint: ref = harv (odkaz)
Zhang, F. (1997). "Čtveřice a matice čtveřic". Lineární algebra a její aplikace. 251: 21–57. doi:10.1016/0024-3795(95)00543-9. ISSN 0024-3795CS1 maint: ref = harv (odkaz) (otevřený archiv).

externí odkazy

[10] Due to the non-commutative nature of the multiplication operation for quaternions and related constructions, care needs to be taken with definitions, most notably in this context, for the determinant. The theorem holds as well for the slightly less well-behaved rozdělené čtveřice viz Alagös, Oral & Yüce (2012). The rings of quaternions and split-quaternions can both be represented by certain $2 \times 2$ složité matice. (When restricted to unit norm, these are the groups $SU (2)$ a $SU(1, 1)$ respectively.) Therefore it is not surprising that the theorem holds.
There is no such matrix representation for the octonions, since the multiplication operation is not associative in this case. However, a modified Cayley–Hamilton theorem still holds for the octonions, see Tian (2000).

[12] An explicit expression for these coefficients is
${displaystyle c_{i}=sum _{k_{1},k_{2},ldots ,k_{n}}prod _{l=1}^{n}{frac {(-1)^{k_{l}+1}}{l^{k_{l}}k_{l}!}}operatorname {tr} (A^{l})^{k_{l}},}$
where the sum is taken over the sets of all integer partitions $k l \geq 0$ splnění rovnice
${displaystyle sum _{l=1}^{n}lk_{l}=n-i.}$

[13] Viz např. Str. 54 of Brown 1994, which solves Jacobiho vzorec,
${displaystyle partial p(lambda )/partial lambda =p(lambda )sum _{m=0}^{infty }lambda ^{-(m+1)}operatorname {tr} A^{m}=p(lambda )~operatorname {tr} {frac {I}{lambda I-A}}equiv operatorname {tr} B~,}$
kde $B$ is the adjugate matrix of the next section.There also exists an equivalent, related recursive algorithm introduced by Urbain Le Verrier a Dmitrij Konstantinovič Faddeev —The Algoritmus Faddeev – LeVerrier, který čte
${displaystyle {egin{aligned}M_{0}&equiv O&c_{n}&=1qquad &(k=0)[5pt]M_{k}&equiv AM_{k-1}-{frac {1}{k-1}}(operatorname {tr} (AM_{k-1}))Iqquad qquad &c_{n-k}&=-{frac {1}{k}}operatorname {tr} (AM_{k})qquad &k=1,ldots ,n~.end{aligned}}}$
(see, e.g., p 88 of Gantmacher 1960.) Observe $A -1 = - M n / C 0$ as the recursion terminates.See the algebraic proof in the following section, which relies on the modes of the adjugate, $B k \equiv M n - k$ . Konkrétně ${displaystyle (lambda I-A)B=Ip(lambda )}$ and the above derivative of $str$ when one traces it yields
${displaystyle lambda p'-np=operatorname {tr} (AB)~,}$ (Hou 1998 ), and the above recursions, in turn.

[Crilly_1-1] A ^b Crilly 1998

[Cayley_1-2] A ^b Cayley 1858, pp. 17–37

[3] Cayley 1889, pp. 475–496

[Hamilton_1864a-4] A ^b Hamilton 1864a

[Hamilton_1864b-5] A ^b Hamilton 1864b

[Hamilton_1862-6] A ^b Hamilton 1862

[7] Atiyah & MacDonald 1969

[Hamilton_1853-8] Hamilton 1853, str. 562

[9] Zhang 1997

[Frobenius_1878-11] A ^b Frobenius 1878

[14] Zeni & Rodrigues 1992

[15] Barut, Zeni & Laufer 1994a

[16] Barut, Zeni & Laufer 1994b

[17] Laufer 1997

[18] Curtright, Fairlie & Zachos 2014

[19] Stein, William. Algebraic Number Theory, a Computational Approach (PDF). p. 29.

[20] Bhatia 1997, str. 7

[21] Garrett 2007, str. 381

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[poznámka 1]

[10]

[pozn. 2]

[pozn. 3]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

Cayley-Hamiltonova věta - Cayley–Hamilton theorem

Příklady

1×1 matice

2×2 matice

Aplikace

Determinant a inverzní matice

n-tá síla matice

Maticové funkce

Algebraická teorie čísel

Důkazy

Předkola

Spojte matice

Přímý algebraický důkaz

Důkaz využívající polynomy s maticovými koeficienty

Syntéza prvních dvou důkazů

Důkaz využívající matice endomorfismů

A bogus "proof": str(A) = det(AIn − A) = det(A − A) = 0

Proofs using methods of abstract algebra

Abstraction and generalizations

Viz také

Poznámky

Poznámky

Reference

externí odkazy

$1\times1$ matice

$2\times2$ matice

A bogus "proof": str(A) = det(AI_n − A) = det(A − A) = 0