Cayley-Hamiltonova věta - Cayley–Hamilton theorem
v lineární algebra, Cayley-Hamiltonova věta (pojmenováno podle matematiků Arthur Cayley a William Rowan Hamilton ) uvádí, že každý čtvercová matice přes komutativní prsten (tak jako nemovitý nebo komplex pole ) uspokojuje své vlastní charakteristická rovnice.
Li A je dané n×n matice a Ján je n×n matice identity, pak charakteristický polynom z A je definován jako[7] , kde det je určující provoz a λ je proměnná pro skalární prvek základního kroužku. Od vstupu do matice jsou (lineární nebo konstantní) polynomy v λ, determinant je také n-tá objednávka monický polynom v λ,
Příklady
1×1 matice
Pro 1×1 matice A = (A1,1), charakteristický polynom je dán vztahem str(λ) =λ − Aa tak str(A) = (A) − A1,1 = 0 je triviální.
2×2 matice
Jako konkrétní příklad pojďme
Jeho charakteristický polynom je dán vztahem
Cayley-Hamiltonova věta tvrdí, že pokud ano definovat
pak
Můžeme ověřit výpočtem, že skutečně,
Obecně 2×2 matice,
charakteristický polynom je dán vztahem str(λ) = λ2 − (A + d)λ + (inzerát − před naším letopočtem), tak to uvádí Cayley-Hamiltonova věta
což je skutečně vždy ten případ, který je evidentní zpracováním záznamů A2.
Aplikace
Determinant a inverzní matice
Pro generála n×n invertibilní matice A, tj. jeden s nenulovou determinantou, A−1 lze tedy zapsat jako (n − 1)-th objednat polynomiální výraz v A: Jak je uvedeno, Cayley-Hamiltonova věta odpovídá identitě
Koeficienty Ci jsou dány elementární symetrické polynomy vlastních čísel A. Použitím Newtonovy identity, elementární symetrické polynomy lze zase vyjádřit pomocí mocninový součet symetrických polynomů vlastních čísel:
kde tr (Ak) je stopa matice Ak. Můžeme tedy vyjádřit Ci pokud jde o stopu pravomocí A.
Obecně vzorec pro koeficienty Ci je uveden v podmínkách úplné exponenciální Polynomy zvonu tak jako [pozn. 2]
Zejména determinant A rovná se (-1)nC0. Determinant lze tedy zapsat jako sledovat identitu:
Podobně lze charakteristický polynom zapsat jako
a vynásobením obou stran číslem A−1 (Poznámka −(−1)n = (−1)n−1), jeden je veden k výrazu pro inverzní k A jako stopová identita,
Další metoda pro získání těchto koeficientů Ck pro generála n×n matice, za předpokladu, že žádný kořen nebude nulový, spoléhá na následující alternativu výraz pro determinant,
Proto na základě Série Mercator,
kde exponenciální pouze je třeba rozšířit na objednávku λ−n, od té doby str(λ) je v pořádku n, čisté záporné síly λ automaticky mizí podle C – H věty. (Opět to vyžaduje prsten obsahující racionální čísla.) Diferenciace tohoto výrazu s ohledem na λ umožňuje obecně vyjádřit koeficienty charakteristického polynomu n jako determinanty m×m matice,[pozn. 3]
- Příklady
Například prvních několik polynomů Bell je B0 = 1, B1(X1) = X1, B2(X1, X2) = X2
1 + X2, a B3(X1, X2, X3) = X3
1 + 3 X1X2 + X3.
Pomocí nich lze určit koeficienty Ci charakteristického polynomu a 2×2 výnosy matice
Koeficient C0 dává determinant 2×2 matice, C1 minus jeho stopa, zatímco jeho inverzní je dán
Je zřejmé z obecného vzorce pro Cn-k, vyjádřeno termíny Bell polynomů, že výrazy
vždy dejte koeficienty Cn−1 z λn−1 a Cn−2 z λn−2 v charakteristickém polynomu libovolného n×n matice, resp. Takže pro 3×3 matice A, vyjádření Cayley-Hamiltonovy věty lze také napsat jako
kde pravá strana označuje a 3×3 matice se všemi položkami sníženými na nulu. Stejně tak tento determinant v n = 3 případ je nyní
Tento výraz dává zápor koeficientu Cn−3 z λn−3 v obecném případě, jak je vidět níže.
Podobně lze psát pro a 4×4 matice A,
kde je nyní determinant Cn−4,
a tak dále pro větší matice. Stále složitější výrazy pro koeficienty Ck je odvoditelný z Newtonovy identity nebo Algoritmus Faddeev – LeVerrier.
n-tá síla matice
Cayley-Hamiltonova věta vždy poskytuje vztah mezi mocnostmi A (i když ne vždy nejjednodušší), což umožňuje zjednodušit výrazy zahrnující takové pravomoci a vyhodnotit je, aniž by bylo nutné vypočítat mocninu An nebo jakékoli vyšší pravomoci A.
Jako příklad pro věta dává
Poté vypočítat A4, pozorovat
Rovněž,
Všimněte si, že jsme byli schopni zapsat sílu matice jako součet dvou členů. Ve skutečnosti maticová síla jakéhokoli řádu k lze psát maximálně jako maticový polynom stupně n - 1, kde n je velikost čtvercové matice. Toto je příklad, kdy Cayley-Hamiltonova věta může být použita k vyjádření maticové funkce, o které budeme systematicky diskutovat níže.
Maticové funkce
Vzhledem k analytické funkci
a charakteristický polynom str(X) stupně n z n × n matice A, funkci lze vyjádřit pomocí dlouhého dělení jako
kde q(X) je nějaký kvocient polynomu a r(X) je zbytek polynomu takový, že 0 ≤ stupně r(X) < n.
Podle Cayley-Hamiltonovy věty, nahrazení X maticí A dává str(A) = 0, takže jeden má
Tedy analytická funkce matice A lze vyjádřit jako maticový polynom stupně menšího než n.
Nechť je zbytek polynom
Od té doby str(λ) = 0, vyhodnocení funkce F(X) na n vlastní čísla A, výnosy
To odpovídá systému n lineární rovnice, které lze řešit za účelem stanovení koeficientů Ci. Jeden tedy má
Když se vlastní čísla opakují, je to λi = λj pro některé já ≠ j, dvě nebo více rovnic je identických; a proto lineární rovnice nelze vyřešit jednoznačně. V takových případech pro vlastní číslo λ s množstvím m, první m – 1 deriváty p (x) zmizet na vlastní hodnotě. To vede k extra m – 1 lineárně nezávislá řešení
které v kombinaci s ostatními poskytují požadované n rovnice k řešení Ci.
Nalezení polynomu, který prochází body (λi, F (λi)) je v podstatě problém interpolace a lze jej vyřešit pomocí Lagrange nebo Newtonova interpolace techniky vedoucí k Sylvesterův vzorec.
Předpokládejme například, že úkolem je najít polynomiální reprezentaci
Charakteristický polynom je str(X) = (X − 1)(X − 3) = X2 − 4X + 3a vlastní čísla jsou λ = 1, 3. Nechat r(X) = C0 + C1X. Hodnocení F(λ) = r(λ) na vlastních hodnotách získá člověk dvě lineární rovnice, Et = C0 + C1 a E3t = C0 + 3C1.
Řešení rovnic poskytuje výnosy C0 = (3Et − E3t)/2 a C1 = (E3t − Et)/2. Z toho tedy vyplývá
Pokud místo toho byla funkce F(A) = hřích Na, pak by koeficienty byly C0 = (3 hříchy t - hřích 3t)/2 a C1 = (hřích 3t - hřích t)/2; proto
Jako další příklad při zvažování
pak je charakteristický polynom str(X) = X2 + 1a vlastní čísla jsou λ = ±i.
Stejně jako dříve nám hodnocení funkce na vlastních číslech dává lineární rovnice Eto = c0 + i c1 a E−to = C0 − ic1; jehož řešení dává, C0 = (Eto + E−to) / 2 = cos t a C1 = (Eto − E−to)/2i = hřích t. V tomto případě tedy
což je rotační matice.
Standardní příklady takového použití jsou exponenciální mapa z Lež algebra a matice Lieova skupina do skupiny. Je to dáno a exponenciální matice,
Takové výrazy jsou již dlouho známé SU (2),
Kde σ jsou Pauliho matice a pro SO (3),
který je Rodriguesův rotační vzorec. Pro zápis viz rotační skupina SO (3) # Poznámka k Lieově algebře.
V poslední době se výrazy objevily i pro jiné skupiny, například Skupina Lorentz SO (3, 1),[11] O (4, 2)[12] a SU (2, 2),[13] stejně jako GL (n, R).[14] Skupina O (4, 2) je konformní skupina z vesmírný čas, SU (2, 2) své jednoduše připojeno kryt (abych byl přesný, jednoduše připojený kryt připojená součást TAK+(4, 2) z O (4, 2)). Získané výrazy platí pro standardní zastoupení těchto skupin. Vyžadují znalosti (některých) z vlastní čísla matice umocnit. Pro SU (2) (a tedy pro SO (3)), byly získány uzavřené výrazy pro Všechno neredukovatelné reprezentace, tj. jakéhokoli spinu.[15]
Algebraická teorie čísel
Cayley-Hamiltonova věta je efektivní nástroj pro výpočet minimálního polynomu algebraických celých čísel. Například vzhledem k konečnému rozšíření z a algebraické celé číslo což je nenulová lineární kombinace můžeme vypočítat minimální polynom z vyhledáním matice představující -lineární transformace
Říkáme tomu transformační matice , pak můžeme najít minimální polynom použitím Cayley-Hamiltonovy věty na .[16]
Důkazy
Cayley-Hamiltonova věta je bezprostředním důsledkem existence Jordan normální forma pro matice nad algebraicky uzavřená pole. V této části jsou uvedeny přímé důkazy.
Jak ukazují výše uvedené příklady, získání tvrzení Cayley-Hamiltonovy věty pro an n×n matice
vyžaduje dva kroky: nejprve koeficienty Ci charakteristického polynomu jsou určeny vývojem jako polynom v t determinantu
a pak jsou tyto koeficienty použity v lineární kombinaci mocnin A to se rovná n×n nulová matice:
Levou stranu lze vypracovat na n×n matice, jejíž položky jsou (enormní) polynomiální výrazy v sadě položek Ai,j z A, takže Cayley-Hamiltonova věta uvádí, že každý z nich n2 výrazy se rovnají 0. Pro jakoukoli pevnou hodnotu n, tyto identity lze získat zdlouhavými, ale přímými algebraickými manipulacemi. Žádný z těchto výpočtů však nemůže ukázat, proč by Cayley-Hamiltonova věta měla platit pro matice všech možných velikostí n, takže jednotný důkaz pro všechny n je potřeba.
Předkola
Pokud vektor proti velikosti n je vlastní vektor z A s vlastním číslem λjinými slovy pokud A⋅proti = λv, pak
což je od té doby nulový vektor str(λ) = 0 (vlastní čísla A jsou přesně kořeny z str(t)). To platí pro všechna možná vlastní čísla λ, takže dvě matice, které teorém přirovnal, jistě dávají stejný (nulový) výsledek, když se použijí na jakýkoli vlastní vektor. Teď když A připouští a základ vlastních vektorů, jinými slovy pokud A je úhlopříčně, pak musí platit Cayley-Hamiltonova věta A, protože dvě matice, které dávají stejné hodnoty při použití na každý prvek základny, musí být stejné.
- produkt vlastních čísel
Zvažte nyní funkci které mapy matice do matice dané vzorcem , tj. který bere matici a zapojí jej do svého charakteristického polynomu. Ne všechny matice jsou diagonalizovatelné, ale pro matice se složitými koeficienty je mnoho z nich: sada diagonalizovatelné komplexní čtvercové matice dané velikosti je hustý v sadě všech takových čtvercových matic[17] (aby byla matice diagonalizovatelná, stačí například, že její charakteristický polynom nemá žádné více kořenů). Nyní viděn jako funkce (protože matice mají vidíme, že tato funkce je kontinuální. To je pravda, protože položky obrazu matice jsou dány polynomy v položkách matice. Od té doby
a od setu je hustý, tato funkce musí kontinuálně mapovat celou sadu matice na nulovou matici. Proto Cayley-Hamiltonova věta platí pro komplexní čísla, a proto musí také platit pro - nebo -hodnotové matice.
I když to poskytuje platný důkaz, argument není příliš uspokojivý, protože identity reprezentované teorémem nijak nezávisí na povaze matice (diagonalizovatelné nebo ne), ani na druhu povolených záznamů (pro matice s skutečné položky, diagonalizovatelné, netvoří hustou množinu a zdá se divné, že by bylo nutné zvážit složité matice, aby bylo vidět, že pro ně platí Cayley-Hamiltonova věta). Budeme tedy nyní uvažovat pouze argumenty, které dokážou větu přímo pro jakoukoli matici pouze pomocí algebraických manipulací; mají také tu výhodu, že pracují pro matice se záznamy v libovolném komutativní prsten.
Existuje celá řada takových důkazů Cayley-Hamiltonovy věty, z nichž několik zde bude uvedeno. Liší se množstvím abstraktních algebraických představ potřebných k pochopení důkazu. Nejjednodušší důkazy používají pouze ty pojmy, které jsou potřebné k formulování věty (matice, polynomy s číselnými vstupy, determinanty), ale zahrnují technické výpočty, které poněkud záhadně činí skutečnost, že vedou přesně ke správnému závěru. Je možné se těmto detailům vyhnout, ale za cenu zapojení jemnějších algebraických představ: polynomy s koeficienty v nekomutativním kruhu nebo matice s neobvyklými druhy záznamů.
Spojte matice
Všechny níže uvedené důkazy používají pojem adjugovaná matice adj (M) z n×n matice M, přemístit jeho kofaktorová matice.
Toto je matice, jejíž koeficienty jsou dány polynomiálními výrazy v koeficientech M (ve skutečnosti jistě (n − 1)×(n − 1) determinanty) takovým způsobem, že platí následující základní vztahy,
Tyto vztahy jsou přímým důsledkem základních vlastností determinantů: hodnocení (i,j) vstup maticového produktu vlevo dává expanzi po sloupci j determinantu matice získané z M nahrazením sloupce i kopií sloupce j, který je det (M) -li i = j a jinak nula; maticový produkt vpravo je podobný, ale pro rozšíření o řádky.
Jelikož jsou důsledkem manipulace s algebraickými výrazy, jsou tyto vztahy platné pro matice s položkami v jakémkoli komutativním kruhu (pro první definici determinantů je třeba předpokládat komutativitu). To je důležité si uvědomit zde, protože tyto vztahy budou použity níže pro matice s nečíselnými položkami, jako jsou polynomy.
Přímý algebraický důkaz
Tento důkaz používá pouze druh objektů potřebných k formulování Cayley-Hamiltonovy věty: matice s polynomy jako vstupy. Matice t ján −A jehož determinant je charakteristický polynom z A je taková matice, a protože polynomy tvoří komutativní kruh, má doplnit
Pak podle pravého základního vztahu adjugátu jeden má
Od té doby B je také matice s polynomy v t jako položky, jeden může, pro každého i , shromáždit koeficienty ti v každé položce tvoří matici B i čísel, která jeden má
(Způsob zápisu B jsou definovány objasňuje, že žádné síly vyšší než tn−1 nastat). Zatímco tohle vzhled jako polynom s maticemi jako koeficienty nebudeme uvažovat o takové představě; je to jen způsob, jak napsat matici s polynomiálními položkami jako lineární kombinaci n konstantní matice a koeficient t i byl napsán nalevo od matice, aby zdůraznil tento úhel pohledu.
Nyní je možné rozšířit maticový produkt v naší rovnici o bilinearitu
Psaní
jeden získá rovnost dvou matic s polynomiálními zápisy, psaných jako lineární kombinace konstantních matic s mocninami t jako koeficienty.
Taková rovnost může platit pouze v případě, že v jakékoli pozici matice je záznam, který je vynásoben danou mocí ti je stejný na obou stranách; z toho vyplývá, že konstantní matice s koeficientem ti v obou výrazech musí být stejné. Psaní těchto rovnic pak pro i z n až na 0, jeden najde
Nakonec vynásobte rovnici koeficientů ti zleva od Aia shrnout:
Levé strany tvoří a teleskopická částka a úplně zrušit; pravé strany součet :
Tím je důkaz dokončen.
Důkaz využívající polynomy s maticovými koeficienty
Tento důkaz je podobný prvnímu, ale pokouší se dát smysl pojmu polynom s maticovými koeficienty, který byl navržen výrazy vyskytujícími se v tomto důkazu. To vyžaduje značnou péči, protože je poněkud neobvyklé uvažovat polynomy s koeficienty v nekomutativním kruhu a v tomto nastavení nelze použít všechny úvahy platné pro komutativní polynomy.
Je pozoruhodné, že zatímco aritmetika polynomů nad komutativním prstencem modeluje aritmetiku polynomiální funkce, toto není případ nekomutativního kruhu (ve skutečnosti v tomto případě neexistuje zjevný pojem polynomiální funkce, která je uzavřena při násobení). Když tedy uvažujeme polynomy v t s maticovými koeficienty, proměnnou t nesmí být považováno za „neznámé“, ale za formální symbol, se kterým se má zacházet podle daných pravidel; zejména nelze jen nastavit t na konkrétní hodnotu.
Nechat být prstenem matice s položkami v nějakém kruhu R (například reálná nebo komplexní čísla), která má A jako prvek. Matice s polynomy jako koeficienty v t, jako nebo jeho adjugát B v prvním důkazu jsou prvky .
Shromažďováním podobných pravomocí t, takové matice lze psát jako "polynomy" v t s konstantními maticemi jako koeficienty; psát si pro množinu takových polynomů. Protože tato sada je v bijection s , odpovídajícím způsobem definuje aritmetické operace, zejména násobení je dáno
respektování pořadí matic koeficientů ze dvou operandů; samozřejmě to dává nekomutativní násobení.
Tedy identita
od prvního důkazu lze nahlížet jako na důkaz zahrnující násobení prvků v .
V tomto okamžiku je lákavé jednoduše nastavit t rovná se matici A , což činí první faktor vlevo rovný nulové matici a pravou stranu rovnou str(A); to však není povolená operace, když nedojíždí koeficienty. Je možné definovat „mapu vyhodnocení vpravo“ evA : M[t] → M, který každý nahrazuje ti výkonem matice Ai z A , kde je stanoveno, že výkon se má vždy vynásobit napravo od příslušného koeficientu.
Tato mapa však není prstencovým homomorfismem: správné hodnocení produktu se obecně liší od produktu správného hodnocení. Je tomu tak proto, že násobení polynomů maticovými koeficienty nemodeluje množení výrazů obsahujících neznámé: produkt je definován za předpokladu, že t dojíždí s N, ale to může selhat, pokud t je nahrazen maticí A.
Tuto obtíž lze obejít v konkrétní konkrétní situaci, protože výše uvedená mapa hodnocení vpravo se stane prstencovým homomorfismem, pokud je matice A je v centrum prstence koeficientů, takže dojíždí se všemi koeficienty polynomů (argument, který to dokazuje, je přímý, právě proto, že dojíždění t s koeficienty je nyní po vyhodnocení oprávněná).
Nyní, A není vždy uprostřed M, ale můžeme nahradit M s menším prstencem za předpokladu, že obsahuje všechny koeficienty dotyčných polynomů: , Aa koeficienty polynomu B. Zřejmou volbou pro takový podřetězec je centralizátor Z z A, podřetězec všech matic, se kterými dojíždíme A; podle definice A je ve středu města Z.
Tento centralizátor samozřejmě obsahuje , a A, ale je třeba ukázat, že obsahuje matice . K tomu je třeba spojit dva základní vztahy pro adjugáty a napsat adjugát B jako polynom:
Rovnání koeficientů ukazuje, že pro každého i, my máme A Bi = Bi A podle přání. Po nalezení správného prostředí, ve kterém evA je skutečně homomorfismus prstenů, lze dokončit důkaz, jak je navrženo výše:
Tím je důkaz dokončen.
Syntéza prvních dvou důkazů
V prvním důkazu bylo možné určit koeficienty Bi z B založeno pouze na pravém základním vztahu pro adjugát. Vlastně první n odvozené rovnice lze interpretovat jako určení kvocientu B z Euklidovské dělení polynomu str(t)Ján nalevo u monický polynom Jánt − A, zatímco konečná rovnice vyjadřuje skutečnost, že zbytek je nula. Toto dělení se provádí v kruhu polynomů s maticovými koeficienty. Opravdu, dokonce přes non-komutativní prsten, euklidovské dělení monickým polynomem P je definován a vždy vytvoří jedinečný kvocient a zbytek se stejnou podmínkou stupně jako v komutativním případě, za předpokladu, že je uvedeno, na které straně si přejete P být faktorem (zde vlevo).
Chcete-li vidět, že kvocient a zbytek jsou jedinečné (což je zde důležitá část prohlášení), stačí napsat tak jako a pozorujte to od té doby P je monický P (Q-Q ') nemůže mít titul menší než P, pokud Q=Q ' .
Ale dividenda str(t)Ján a dělitel Jánt−A zde použité oba leží v podřetězci (R[A])[t], kde R[A] je podřetězec maticového kruhu M(n, R) generováno uživatelem A: R-lineární rozpětí všech sil A. Proto lze euklidovské dělení ve skutečnosti provádět v rámci toho komutativní polynomiální kruh, a ten pak samozřejmě dává stejný podíl B a zbytek 0 jako ve větším kruhu; zejména to ukazuje B ve skutečnosti spočívá v (R[A])[t].
Ale v tomto komutativním nastavení je platné nastavit t na A v rovnici
jinými slovy, použít hodnotící mapu
což je kruhový homomorfismus, dávající
stejně jako v druhém důkazu, jak bylo požadováno.
Kromě prokázání věty nám výše uvedený argument říká, že koeficienty Bi z B jsou polynomy v A, zatímco z druhého důkazu jsme věděli jen to, že leží v centralizátoru Z z A; obecně Z je větší podřetězec než R[A], a nemusí být nutně komutativní. Zejména konstantní termín B0= adj (-A) leží v R[A]. Od té doby A je libovolná čtvercová matice, to dokazuje adj (A) lze vždy vyjádřit jako polynom v A (s koeficienty, které závisí na A).
Ve skutečnosti rovnice nalezené v prvním důkazu umožňují postupné vyjádření jako polynomy v A, což vede k identitě
platí pro všechny n×n matice, kde
je charakteristický polynom z A.
Všimněte si, že tato identita také implikuje tvrzení Cayley-Hamiltonovy věty: jeden se může pohybovat adj (-A) na pravé straně vynásobte výslednou rovnici (vlevo nebo vpravo) číslem Aa využij toho, že
Důkaz využívající matice endomorfismů
Jak již bylo zmíněno výše, matice str(A) ve výroku věty se získá tak, že se nejprve vyhodnotí determinant a poté se dosadí matice A pro t; dělá tuto substituci do matice před hodnocením determinantu nemá smysl. Je však možné podat výklad, kde str(A) se získá přímo jako hodnota určitého determinantu, vyžaduje to však složitější nastavení, jednu z matic přes prsten, ve kterém lze interpretovat obě položky z Aa všechny A sám. Dalo by se vzít za to prsten M(n, R) z n×n matice přes R, kde je položka je realizován jako , a A jako sám. Ale považování matic s maticemi za položky může způsobit záměnu s blokové matice, což není zamýšleno, protože to dává nesprávný pojem determinantu (připomeňme, že determinant matice je definován jako součet produktů jejích položek, a v případě blokové matice to obecně není totéž jako odpovídající součet produktů jejích bloků!). Je jasnější rozlišovat A z endomorfismu φ z n-dimenzionální vektorový prostor PROTI (nebo zdarma R-modul, pokud R není pole) definované na základě , a vzít matice přes kruh Konec (PROTI) všech těchto endomorfismů. Pak φ ∈ Konec (PROTI) je možný záznam matice, zatímco A označuje prvek M(n, Konec(PROTI)) jehož i,j entry is endomorphism of scalar multiplication by ; podobně will be interpreted as element of M(n, End(PROTI)). However, since End(PROTI) is not a commutative ring, no determinant is defined on M(n, End(PROTI)); this can only be done for matrices over a commutative subring of End(PROTI). Now the entries of the matrix all lie in the subring R[φ] generated by the identity and φ, což je komutativní. Then a determinant map M(n, R[φ]) → R[φ] is defined, and evaluates to the value str(φ) of the characteristic polynomial of A na φ (this holds independently of the relation between A a φ); the Cayley–Hamilton theorem states that str(φ) is the null endomorphism.
In this form, the following proof can be obtained from that of (Atiyah & MacDonald 1969, Prop. 2.4) (which in fact is the more general statement related to the Nakayama lemma; one takes for the ideal in that proposition the whole ring R). Skutečnost, že A is the matrix of φ v základu E1, ..., En znamená, že
One can interpret these as n components of one equation in PROTIn, whose members can be written using the matrix-vector product M(n, End(PROTI)) × PROTIn → PROTIn that is defined as usual, but with individual entries ψ ∈ End(PROTI) a proti v PROTI being "multiplied" by forming ; this gives:
kde is the element whose component i je Ei (in other words it is the basis E1, ..., En z PROTI written as a column of vectors). Writing this equation as
one recognizes the přemístit matice considered above, and its determinant (as element of M(n, R[φ])) is also str(φ). To derive from this equation that str(φ) = 0 ∈ End(PROTI), one left-multiplies by the adjugate matrix z , which is defined in the matrix ring M(n, R[φ]), giving
the associativity of matrix-matrix and matrix-vector multiplication used in the first step is a purely formal property of those operations, independent of the nature of the entries. Now component i of this equation says that str(φ)(Ei) = 0 ∈ PROTI; tím pádem str(φ) vanishes on all Ei, and since these elements generate PROTI z toho vyplývá, že str(φ) = 0 ∈ End(PROTI), completing the proof.
One additional fact that follows from this proof is that the matrix A whose characteristic polynomial is taken need not be identical to the value φ substituted into that polynomial; it suffices that φ be an endomorphism of PROTI satisfying the initial equations
pro nějaký sled prvků E1,...,En které generují PROTI (which space might have smaller dimension than n, or in case the ring R is not a field it might not be a bezplatný modul at all).
A bogus "proof": str(A) = det(AIn − A) = det(A − A) = 0
One persistent elementary but nesprávný argument[18] for the theorem is to "simply" take the definition
a nahradit A pro λ, získávání
There are many ways to see why this argument is wrong. First, in Cayley–Hamilton theorem, str(A) je n×n matrix. However, the right hand side of the above equation is the value of a determinant, which is a skalární. So they cannot be equated unless n = 1 (i.e. A is just a scalar). Second, in the expression , the variable λ actually occurs at the diagonal entries of the matrix . To illustrate, consider the characteristic polynomial in the previous example again:
If one substitutes the entire matrix A pro λ in those positions, one obtains
in which the "matrix" expression is simply not a valid one. Note, however, that if scalar multiples of identity matricesinstead of scalars are subtracted in the above, i.e. if the substitution is performed as
then the determinant is indeed zero, but the expanded matrix in question does not evaluate to ; nor can its determinant (a scalar) be compared to str(A) (a matrix). So the argument that still does not apply.
Actually, if such an argument holds, it should also hold when other multilinear forms instead of determinant is used. For instance, if we consider the trvalý function and define , then by the same argument, we should be able to "prove" that q(A) = 0. But this statement is demonstrably wrong. In the 2-dimensional case, for instance, the permanent of a matrix is given by
So, for the matrix A in the previous example,
Yet one can verify that
One of the proofs for Cayley–Hamilton theorem above bears some similarity to the argument that . By introducing a matrix with non-numeric coefficients, one can actually let A live inside a matrix entry, but then se nerovná A, and the conclusion is reached differently.
Proofs using methods of abstract algebra
Basic properties of Hasse–Schmidt derivations na vnější algebra některých B-modul M (supposed to be free and of finite rank) have been used by Gatto & Salehyan (2016, §4) to prove the Cayley–Hamilton theorem. Viz také Gatto & Scherbak (2015).
Abstraction and generalizations
The above proofs show that the Cayley–Hamilton theorem holds for matrices with entries in any commutative ring R, a to str(φ) = 0 will hold whenever φ is an endomorphism of an R module generated by elements E1,...,En to uspokojuje
This more general version of the theorem is the source of the celebrated Nakayama lemma in commutative algebra and algebraic geometry.
Viz také
Poznámky
- ^ Due to the non-commutative nature of the multiplication operation for quaternions and related constructions, care needs to be taken with definitions, most notably in this context, for the determinant. The theorem holds as well for the slightly less well-behaved rozdělené čtveřice viz Alagös, Oral & Yüce (2012). The rings of quaternions and split-quaternions can both be represented by certain 2 × 2 složité matice. (When restricted to unit norm, these are the groups SU (2) a SU(1, 1) respectively.) Therefore it is not surprising that the theorem holds.
There is no such matrix representation for the octonions, since the multiplication operation is not associative in this case. However, a modified Cayley–Hamilton theorem still holds for the octonions, see Tian (2000). - ^ An explicit expression for these coefficients is
- ^ Viz např. Str. 54 of Brown 1994, which solves Jacobiho vzorec,
- (Hou 1998 ), and the above recursions, in turn.
Poznámky
- ^ A b Crilly 1998
- ^ A b Cayley 1858, pp. 17–37
- ^ Cayley 1889, pp. 475–496
- ^ A b Hamilton 1864a
- ^ A b Hamilton 1864b
- ^ A b Hamilton 1862
- ^ Atiyah & MacDonald 1969
- ^ Hamilton 1853, str. 562
- ^ Zhang 1997
- ^ A b Frobenius 1878
- ^ Zeni & Rodrigues 1992
- ^ Barut, Zeni & Laufer 1994a
- ^ Barut, Zeni & Laufer 1994b
- ^ Laufer 1997
- ^ Curtright, Fairlie & Zachos 2014
- ^ Stein, William. Algebraic Number Theory, a Computational Approach (PDF). p. 29.
- ^ Bhatia 1997, str. 7
- ^ Garrett 2007, str. 381
Reference
- Alagös, Y.; Oral, K.; Yüce, S. (2012). "Split Quaternion Matrices". Miskolc Mathematical Notes. 13 (2): 223–232. doi:10.18514/MMN.2012.364. ISSN 1787-2405CS1 maint: ref = harv (odkaz) (otevřený přístup)
- Atiyah, M. F.; MacDonald, I. G. (1969), Úvod do komutativní algebry, Westview Press, ISBN 978-0-201-40751-8
- Barut, A. O.; Zeni, J. R.; Laufer, A. (1994a). "The exponential map for the conformal group O(2,4)". J. Phys. A: Math. Gen. 27 (15): 5239–5250. arXiv:hep-th/9408105. Bibcode:1994JPhA...27.5239B. doi:10.1088/0305-4470/27/15/022.CS1 maint: ref = harv (odkaz)
- Barut, A. O.; Zeni, J. R.; Laufer, A. (1994b). "The exponential map for the unitary group SU(2,2)". J. Phys. A: Math. Gen. 27 (20): 6799–6806. arXiv:hep-th/9408145. Bibcode:1994JPhA...27.6799B. doi:10.1088/0305-4470/27/20/017.CS1 maint: ref = harv (odkaz)
- Bhatia, R. (1997). Maticová analýza. Maturitní texty z matematiky. 169. Springer. ISBN 978-0387948461.CS1 maint: ref = harv (odkaz)
- Brown, Lowell S. (1994). Teorie kvantového pole. Cambridge University Press. ISBN 978-0-521-46946-3.CS1 maint: ref = harv (odkaz)
- Cayley, A. (1858). "A Memoir on the Theory of Matrices". Philos. Trans. 148.CS1 maint: ref = harv (odkaz)
- Cayley, A. (1889). The Collected Mathematical Papers of Arthur Cayley. (Classic Reprint). 2. Zapomenuté knihy. JAKO V B008HUED9O.CS1 maint: ref = harv (odkaz)
- Crilly, T. (1998). "The young Arthur Cayley". Poznámky Rec. R. Soc. Lond. 52 (2): 267–282. doi:10.1098/rsnr.1998.0050.CS1 maint: ref = harv (odkaz)
- Curtright, T L; Fairlie, D B; Zachos, C K (2014). "Kompaktní vzorec pro rotace jako polynomy spinové matice". SIGMA. 10 (2014): 084. arXiv:1402.3541. Bibcode:2014SIGMA..10..084C. doi:10.3842 / SIGMA.2014.084.CS1 maint: ref = harv (odkaz)
- Frobenius, G. (1878). "Ueber lineare Substutionen und bilineare Formen". J. Reine Angew. Matematika. 1878 (84): 1–63. doi:10.1515/crll.1878.84.1.CS1 maint: ref = harv (odkaz)
- Gantmacher, F.R. (1960). Teorie matic. NY: Chelsea Publishing. ISBN 978-0-8218-1376-8.CS1 maint: ref = harv (odkaz)
- Gatto, Letterio; Salehyan, Parham (2016), Hasse–Schmidt derivations on Grassmann algebrasSpringer, doi:10.1007/978-3-319-31842-4, ISBN 978-3-319-31842-4, PAN 3524604
- Gatto, Letterio; Scherbak, Inna (2015), Remarks on the Cayley-Hamilton Theorem, arXiv:1510.03022
- Garrett, Paul B. (2007). Abstraktní algebra. NY: Chapman and Hall/CRC. ISBN 978-1584886891.CS1 maint: ref = harv (odkaz)
- Hamilton, W. R. (1853). Přednášky o čtveřicích. Dublin.CS1 maint: ref = harv (odkaz)
- Hamilton, W. R. (1864a). "On a New and General Method of Inverting a Linear and Quaternion Function of a Quaternion". Sborník Královské irské akademie. viii: 182–183.CS1 maint: ref = harv (odkaz) (communicated on June 9, 1862)
- Hamilton, W. R. (1864b). "On the Existence of a Symbolic and Biquadratic Equation, which is satisfied by the Symbol of Linear Operation in Quaternions". Sborník Královské irské akademie. viii: 190–101.CS1 maint: ref = harv (odkaz) (communicated on June 23, 1862)
- Hou, S. H. (1998). "Classroom Note: A Simple Proof of the Leverrier--Faddeev Characteristic Polynomial Algorithm". Recenze SIAM. 40 (3): 706–709. Bibcode:1998SIAMR..40..706H. doi:10.1137 / S003614459732076X.CS1 maint: ref = harv (odkaz) „Poznámka k učebně: Jednoduchý důkaz Leverriera - Faddeevův charakteristický polynomiální algoritmus“
- Hamilton, W. R. (1862). „O existenci symbolické a bikvadratické rovnice, kterou splňuje Symbol lineární nebo distribuční operace na čtveřici“. The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science. série iv. 24: 127–128. ISSN 1478-6435. Citováno 2015-02-14.CS1 maint: ref = harv (odkaz)
- Majitel domácnosti, Alston S. (2006). Teorie matic v numerické analýze. Dover knihy o matematice. ISBN 978-0486449722.CS1 maint: ref = harv (odkaz)
- Laufer, A. (1997). Msgstr "Exponenciální mapa GL (N)". J. Phys. A: Math. Gen. 30 (15): 5455–5470. arXiv:hep-th / 9604049. Bibcode:1997JPhA ... 30.5455L. doi:10.1088/0305-4470/30/15/029.CS1 maint: ref = harv (odkaz)
- Tian, Y. (2000). Msgstr "Maticové reprezentace oktonionů a jejich aplikace". Pokroky v aplikované Cliffordské algebře. 10 (1): 61–90. arXiv:matematika / 0003166. CiteSeerX 10.1.1.237.2217. doi:10.1007 / BF03042010. ISSN 0188-7009.CS1 maint: ref = harv (odkaz)
- Zeni, J. R .; Rodrigues, W.A. (1992). „Promyšlená studie Lorentzových transformací Cliffordových algeber“. Int. J. Mod. Phys. A. 7 (8): 1793 stran Bibcode:1992 IJMPA ... 7.1793Z. doi:10.1142 / S0217751X92000776.CS1 maint: ref = harv (odkaz)
- Zhang, F. (1997). "Čtveřice a matice čtveřic". Lineární algebra a její aplikace. 251: 21–57. doi:10.1016/0024-3795(95)00543-9. ISSN 0024-3795CS1 maint: ref = harv (odkaz) (otevřený archiv).