Jensensova nerovnost - Jensens inequality - Wikipedia

Jensenova nerovnost zevšeobecňuje tvrzení, že sečanovaná čára konvexní funkce leží nad grafem.

Vizualizace konvexity a Jensenovy nerovnosti

v matematika, Jensenova nerovnost, pojmenovaný po dánském matematikovi Johan Jensen, souvisí hodnota a konvexní funkce z integrální k integrálu konvexní funkce. Bylo prokázáno Jensenem v roce 1906.^[1] Vzhledem k jeho obecnosti se nerovnost objevuje v mnoha formách v závislosti na kontextu, z nichž některé jsou uvedeny níže. Ve své nejjednodušší formě nerovnost uvádí, že konvexní transformace průměru je menší nebo rovna průměru použitému po konvexní transformaci; je jednoduchým důsledkem, že u konkávních transformací je to naopak.

Jensenova nerovnost zobecňuje tvrzení, že sekanční čára konvexní funkce leží výše graf funkce, což je Jensenova nerovnost pro dva body: sečna se skládá z vážených průměrů konvexní funkce (pro t ∈ [0,1]),

{ displaystyle tf (x_ {1}) + (1-t) f (x_ {2}),}

zatímco graf funkce je konvexní funkcí váženého průměru,

{ displaystyle f left (tx_ {1} + (1-t) x_ {2} right).}

Jensenova nerovnost tedy je

{ displaystyle f left (tx_ {1} + (1-t) x_ {2} right) leq tf (x_ {1}) + (1-t) f (x_ {2}).}

V kontextu teorie pravděpodobnosti, obecně se uvádí v následující podobě: pokud X je náhodná proměnná a $φ$ je tedy konvexní funkce

{ displaystyle varphi left ( operatorname {E} [X] right) leq operatorname {E} left [ varphi (X) right].}

Rozdíl mezi oběma stranami nerovnosti, ${ displaystyle operatorname {E} left [ varphi (X) right] - varphi left ( operatorname {E} [X] right)}$ , se nazývá Jensenova mezera.^[2]

Prohlášení

Klasická forma Jensenovy nerovnosti zahrnuje několik čísel a vah. Nerovnost lze obecně konstatovat buď pomocí jazyka teorie míry nebo (ekvivalentně) pravděpodobnost. V pravděpodobnostní situaci lze nerovnost dále zobecnit na její plná síla.

Konečná forma

Opravdu konvexní funkce ${ displaystyle varphi}$ , čísla ${ displaystyle x_ {1}, x_ {2}, ldots, x_ {n}}$ v jeho doméně a kladné váhy ${ displaystyle a_ {i}}$ , Jensenovu nerovnost lze konstatovat jako:

{ displaystyle varphi left ({ frac { sum a_ {i} x_ {i}} { sum a_ {i}}} right) leq { frac { sum a_ {i} varphi ( x_ {i})} { součet a_ {i}}} qquad qquad (1)}

a nerovnost je obrácena, pokud ${ displaystyle varphi}$ je konkávní, který je

{ displaystyle varphi left ({ frac { sum a_ {i} x_ {i}} { sum a_ {i}}} right) geq { frac { sum a_ {i} varphi ( x_ {i})} { součet a_ {i}}}. qquad qquad (2)}

Rovnost platí tehdy a jen tehdy ${ displaystyle x_ {1} = x_ {2} = cdots = x_ {n}}$ nebo ${ displaystyle varphi}$ je lineární na doméně obsahující ${ displaystyle x_ {1}, x_ {2}, cdots, x_ {n}}$ .

Jako zvláštní případ, pokud váhy ${ displaystyle a_ {i}}$ jsou si všechny rovny, pak (1) a (2) se stanou

{ displaystyle varphi left ({ frac { sum x_ {i}} {n}} right) leq { frac { sum varphi (x_ {i})} {n}} qquad qquad (3)}

{ displaystyle varphi left ({ frac { sum x_ {i}} {n}} right) geq { frac { sum varphi (x_ {i})} {n}} qquad qquad (4)}

Například funkce $log (X)$ je konkávní, takže střídání ${ displaystyle varphi (x) = log (x)}$ v předchozím vzorci (4) se stanoví (logaritmus) známého aritmeticko-střední / geometricky-střední nerovnost:

{ displaystyle log ! left ({ frac { sum _ {i = 1} ^ {n} x_ {i}} {n}} right) geq { frac { sum _ {i = 1} ^ {n} log ! Left (x_ {i} right)} {n}} quad { text {or}} quad { frac {x_ {1} + x_ {2} + cdots + x_ {n}} {n}} geq { sqrt [{n}] {x_ {1} cdot x_ {2} cdots x_ {n}}}}

Běžná aplikace má ${ displaystyle x}$ jako funkce jiné proměnné (nebo sady proměnných) ${ displaystyle t}$ , to znamená, ${ displaystyle x_ {i} = g (t_ {i})}$ . To vše se přenáší přímo na obecný souvislý případ: váhy $A i$ jsou nahrazeny nezápornou integrovatelnou funkcí $F (X)$ , jako je rozdělení pravděpodobnosti, a součty jsou nahrazeny integrály.

Míra-teoretická a pravděpodobnostní forma

Nechat ${ displaystyle ( Omega, A, mu)}$ být pravděpodobnostní prostor, takový, že ${ displaystyle mu ( Omega) = 1}$ . Li ${ displaystyle g}$ je nemovitý -hodnotená funkce, která je ${ displaystyle mu}$ -integrovatelný, a pokud ${ displaystyle varphi}$ je konvexní funkce na skutečné lince, pak:

{ Displaystyle varphi left ( int _ { Omega} g , d mu right) leq int _ { Omega} varphi circ g , d mu.}

Ve skutečné analýze můžeme požadovat odhad na

{ displaystyle varphi left ( int _ {a} ^ {b} f (x) , dx right),}

kde ${ displaystyle a, b in mathbb {R}}$ , a ${ displaystyle f colon [a, b] to mathbb {R}}$ je nezáporný Lebesgue-integrovatelný funkce. V tomto případě je Lebesgueova míra ${ displaystyle [a, b]}$ nemusí být jednota. Integrací substitucí však lze interval změnit tak, aby měl míru jednoty. Pak lze Jensenovu nerovnost použít k získání^[3]

{ displaystyle varphi left ({ frac {1} {ba}} int _ {a} ^ {b} f (x) , dx right) leq { frac {1} {ba}} int _ {a} ^ {b} varphi (f (x)) , dx.}

Stejný výsledek lze ekvivalentně uvést v a teorie pravděpodobnosti nastavení jednoduchou změnou notace. Nechat ${ displaystyle ( Omega, { mathfrak {F}}, operatorname {P})}$ být pravděpodobnostní prostor, X an integrovatelný skutečný náhodná proměnná a $φ$ A konvexní funkce. Pak:

{ displaystyle varphi left ( operatorname {E} [X] right) leq operatorname {E} left [ varphi (X) right].}

V tomto nastavení pravděpodobnosti míra $μ$ je míněno jako pravděpodobnost ${ displaystyle operatorname {P}}$ , integrál s ohledem na $μ$ jako očekávaná hodnota ${ displaystyle operatorname {E}}$ a funkce ${ displaystyle g}$ jako náhodná proměnná X.

Všimněte si, že rovnost platí právě tehdy $φ$ je lineární funkce na nějaké množině ${ displaystyle A}$ takhle ${ displaystyle mathrm {P} (X v A) = 1}$ (což následuje kontrolou níže uvedeného teoretického důkazu opatření).

Obecná nerovnost v pravděpodobnostním prostředí

Obecněji řečeno T být skutečný topologický vektorový prostor, a X A T-hodnota integrovatelný náhodná proměnná. V tomto obecném nastavení integrovatelný znamená, že existuje prvek ${ displaystyle operatorname {E} [X]}$ v T, tak, že pro jakýkoli prvek z v dvojí prostor z T: ${ displaystyle operatorname {E} | langle z, X rangle | < infty}$ , a ${ displaystyle langle z, operatorname {E} [X] rangle = operatorname {E} [ langle z, X rangle]}$ . Pak pro jakoukoli měřitelnou konvexní funkci $φ$ a jakékoli dílčíσ-algebra ${ displaystyle { mathfrak {G}}}$ z ${ displaystyle { mathfrak {F}}}$ :

{ displaystyle varphi left ( operatorname {E} left [X mid { mathfrak {G}} right] right) leq operatorname {E} left [ varphi (X) mid { mathfrak {G}} vpravo].}

Tady ${ displaystyle operatorname {E} [ cdot mid { mathfrak {G}}]}$ znamená očekávání podmíněno k σ-algebře ${ displaystyle { mathfrak {G}}}$ . Toto obecné tvrzení se redukuje na předchozí, když topologický vektorový prostor $T$ je skutečná osa, a ${ displaystyle { mathfrak {G}}}$ je triviální $σ$ -algebra ${\emptyset, Ω}$ (kde $\emptyset$ je prázdná sada, a $Ω$ je ukázkový prostor ).^[4]

Naostřený a zobecněný tvar

Nechat X být jednorozměrná náhodná proměnná se střední hodnotou ${ displaystyle mu}$ a rozptyl ${ displaystyle sigma ^ {2} geq 0}$ . Nechat ${ displaystyle varphi (x)}$ být dvakrát rozlišitelnou funkcí a definovat funkci

{ Displaystyle h (x) triangleq { frac { varphi vlevo (x right) - varphi left ( mu right)} { left (x- mu right) ^ {2}} } - { frac { varphi ' left ( mu right)} {x- mu}}.}

Pak^[5]

{ displaystyle sigma ^ {2} inf { frac { varphi '' (x)} {2}} leq sigma ^ {2} inf h (x) leq E left [ varphi left (X right) right] - varphi left (E [X] right) leq sigma ^ {2} sup h (x) leq sigma ^ {2} sup { frac { varphi '' (x)} {2}}.}

Zejména když ${ displaystyle varphi (x)}$ je tedy konvexní ${ displaystyle varphi '(x) geq 0}$ , a okamžitě následuje standardní forma Jensenovy nerovnosti pro případ, kdy ${ displaystyle varphi (x)}$ dále se předpokládá, že je dvakrát diferencovatelný.

Důkazy

Grafický „důkaz“ Jensenovy nerovnosti pro pravděpodobnostní případ. Přerušovaná křivka podél

X

osa je hypotetické rozdělení

X

, zatímco přerušovaná křivka podél

Y

osa je odpovídající distribuce

Y

hodnoty. Všimněte si, že konvexní mapování

Y (X)

stále více "roztahuje" distribuci pro zvyšování hodnot

X

.

Toto je důkaz beze slov o Jensenově nerovnosti pro

n

proměnné. Bez ztráty obecnosti je součet kladných vah

1

. Z toho vyplývá, že vážený bod leží v konvexním trupu původních bodů, který leží nad samotnou funkcí podle definice konvexity. Následuje závěr.^[6]

Jensenovu nerovnost lze prokázat několika způsoby a budou nabídnuty tři různé důkazy odpovídající různým výše uvedeným tvrzením. Než se pustíme do těchto matematických derivací, stojí za to analyzovat intuitivní grafický argument založený na pravděpodobnostním případě, kdy $X$ je reálné číslo (viz obrázek). Za předpokladu hypotetického rozdělení $X$ hodnot, lze okamžitě identifikovat polohu ${ displaystyle operatorname {E} [X]}$ a jeho image ${ displaystyle varphi ( operatorname {E} [X])}$ v grafu. Všimněte si, že pro konvexní mapování $Y = φ (X)$ odpovídající rozdělení $Y$ hodnoty se stále více "roztahují" pro zvyšování hodnot $X$ , je snadné vidět, že distribuce $Y$ je širší v intervalu odpovídajícím $X > X 0$ a užší $X < X 0$ pro všechny $X 0$ ; to platí také pro ${ displaystyle X_ {0} = operatorname {E} [X]}$ . V důsledku toho je na tomto obrázku očekávání $Y$ se vždy posune nahoru s ohledem na polohu ${ displaystyle varphi ( operatorname {E} [X])}$ . Podobné úvahy platí, pokud je distribuce $X$ pokrývá klesající část konvexní funkce nebo její klesající i rostoucí část. To „dokazuje“ nerovnost, tj.

{ displaystyle varphi ( operatorname {E} [X]) leq operatorname {E} [ varphi (X)] = operatorname {E} [Y],}

s rovností, když $φ (X)$ není striktně konvexní, např. když je to přímka, nebo kdy $X$ následuje a zdegenerovaná distribuce (tj. je konstanta).

Důkazy níže formalizují tuto intuitivní představu.

Důkaz 1 (konečná forma)

Li $λ 1$ a $λ 2$ jsou dvě libovolná nezáporná reálná čísla taková $λ 1 + λ 2 = 1$ pak konvexnost $φ$ naznačuje

{ displaystyle forall x_ {1}, x_ {2}: qquad varphi left ( lambda _ {1} x_ {1} + lambda _ {2} x_ {2} right) leq lambda _ {1} , varphi (x_ {1}) + lambda _ {2} , varphi (x_ {2}).}

To lze snadno zobecnit: pokud $λ 1, ..., λ n$ jsou záporná reálná čísla taková, že $λ 1 + ... + λ n = 1$ , pak

{ displaystyle varphi ( lambda _ {1} x_ {1} + lambda _ {2} x_ {2} + cdots + lambda _ {n} x_ {n}) leq lambda _ {1} , varphi (x_ {1}) + lambda _ {2} , varphi (x_ {2}) + cdots + lambda _ {n} , varphi (x_ {n}),}

pro všechny $X 1, ..., X n$ . Tento konečná forma Jensenovy nerovnosti lze dokázat indukce: hypotézami konvexity je tvrzení pravdivé pro n = 2. Předpokládejme, že to platí i pro některé n, je třeba to dokázat $n + 1$ . Alespoň jeden z $λ i$ je přísně pozitivní, řekněme $λ 1$ ; proto konvexní nerovností:

{ displaystyle { begin {zarovnáno} varphi left ( sum _ {i = 1} ^ {n + 1} lambda _ {i} x_ {i} right) & = varphi left ( lambda _ {1} x_ {1} + (1- lambda _ {1}) sum _ {i = 2} ^ {n + 1} { frac { lambda _ {i}} {1- lambda _ {1}}} x_ {i} right) & leq lambda _ {1} , varphi (x_ {1}) + (1- lambda _ {1}) varphi left ( součet _ {i = 2} ^ {n + 1} { frac { lambda _ {i}} {1- lambda _ {1}}} x_ {i} right). end {zarovnáno}}}

Od té doby

{ displaystyle sum _ {i = 2} ^ {n + 1} { frac { lambda _ {i}} {1- lambda _ {1}}} = 1,}

lze použít indukční hypotézy na poslední člen v předchozím vzorci, abychom získali výsledek, konkrétně konečnou formu Jensenovy nerovnosti.

Abychom z této konečné formy získali obecnou nerovnost, je třeba použít argument hustoty. Konečnou formu lze přepsat jako:

{ Displaystyle varphi left ( int x , d mu _ {n} (x) right) leq int varphi (x) , d mu _ {n} (x),}

kde μ_n je míra daná libovolně konvexní kombinace z Dirac delty:

{ displaystyle mu _ {n} = součet _ {i = 1} ^ {n} lambda _ {i} delta _ {x_ {i}}.}

Protože konvexní funkce jsou kontinuální, a protože konvexní kombinace delta delta jsou slabě hustý v souboru pravděpodobnostních opatření (jak lze snadno ověřit) je obecné tvrzení získáno jednoduše omezujícím postupem.

Důkaz 2 (míra-teoretická forma)

Nechat G být skutečnou hodnotou μ-integrovatelné funkce v prostoru pravděpodobnosti Ω, a nechat $φ$ být konvexní funkcí na reálných číslech. Od té doby $φ$ je konvexní, u každého reálného čísla $X$ máme neprázdnou sadu subderiváty, které lze považovat za čáry dotýkající se grafu $φ$ na $X$ , ale které jsou na nebo pod grafem $φ$ ve všech bodech (podpůrné čáry grafu).

Nyní, pokud definujeme

{ displaystyle x_ {0}: = int _ { Omega} g , d mu,}

z důvodu existence subderivátů pro konvexní funkce si můžeme vybrat A a b takhle

{ displaystyle sekera + b leq varphi (x),}

pro všechny skutečné $X$ a

{ displaystyle ax_ {0} + b = varphi (x_ {0}).}

Ale pak tu máme

{ displaystyle varphi circ g (x) geq ag (x) + b}

pro všechny $X$ . Protože máme míru pravděpodobnosti, integrál je monotónní s $μ (Ω) = 1$ aby

{ displaystyle int _ { Omega} varphi circ g , d mu geq int _ { Omega} (ag + b) , d mu = a int _ { Omega} g , d mu + b int _ { Omega} d mu = ax_ {0} + b = varphi (x_ {0}) = varphi left ( int _ { Omega} g , d mu right),}

podle přání.

Důkaz 3 (obecná nerovnost v pravděpodobnostním prostředí)

Nechat X být integrovatelná náhodná proměnná, která přijímá hodnoty ve skutečném topologickém vektorovém prostoru T. Od té doby ${ displaystyle varphi: T to mathbb {R}}$ je konvexní, pro všechny ${ displaystyle x, y v T}$ , množství

{ displaystyle { frac { varphi (x + theta , y) - varphi (x)} { theta}},}

klesá jako $θ$ blíží 0⁺. Zejména subdiferenciální z ${ displaystyle varphi}$ hodnoceno na $X$ ve směru $y$ je dobře definován

{ displaystyle (D varphi) (x) cdot y: = lim _ { theta downarrow 0} { frac { varphi (x + theta , y) - varphi (x)} { theta }} = inf _ { theta neq 0} { frac { varphi (x + theta , y) - varphi (x)} { theta}}.}

Je snadno vidět, že subdiferenciál je lineární $y$ ^{[Citace je zapotřebí ]} (to je nepravdivé a tvrzení vyžaduje prokázání Hahn-Banachovy věty) a protože infimum přijaté na pravé straně předchozího vzorce je menší než hodnota stejného výrazu pro $θ = 1$ , jeden dostane

{ displaystyle varphi (x) leq varphi (x + y) - (D varphi) (x) cdot y.}

Zejména pro libovolný dílčí $σ$ -algebra ${ displaystyle { mathfrak {G}}}$ můžeme vyhodnotit poslední nerovnost, když ${ displaystyle x = operatorname {E} [X mid { mathfrak {G}}], , y = X- operatorname {E} [X mid { mathfrak {G}}]}$ získat

{ displaystyle varphi ( operatorname {E} [X mid { mathfrak {G}}]) leq varphi (X) - (D varphi) ( operatorname {E} [X mid { mathfrak {G}}])) cdot (X- operatorname {E} [X mid { mathfrak {G}}]).}

Nyní, pokud vezmeme podmíněné očekávání ${ displaystyle { mathfrak {G}}}$ na obou stranách předchozího výrazu dostaneme výsledek, protože:

{ displaystyle operatorname {E} left [ left [(D varphi) ( operatorname {E} [X mid { mathfrak {G}}])) cdot (X- operatorname {E} [X mid { mathfrak {G}}]) right] mid { mathfrak {G}} right] = (D varphi) ( operatorname {E} [X mid { mathfrak {G}}] ) cdot operatorname {E} [ left (X- operatorname {E} [X mid { mathfrak {G}}] right) mid { mathfrak {G}}] = 0,}

linearitou subdiferenciálu v y proměnná a následující známá vlastnost souboru podmíněné očekávání:

{ displaystyle operatorname {E} left [ left ( operatorname {E} [X mid { mathfrak {G}}] right) mid { mathfrak {G}} right] = operatorname { E} [X mid { mathfrak {G}}].}

Aplikace a zvláštní případy

Forma zahrnující funkci hustoty pravděpodobnosti

Předpokládat $Ω$ je měřitelná podmnožina skutečné linie a F(X) je nezáporná funkce taková

{ displaystyle int _ {- infty} ^ { infty} f (x) , dx = 1.}

V pravděpodobnostním jazyce, F je funkce hustoty pravděpodobnosti.

Pak se Jensenova nerovnost stává následujícím výrokem o konvexních integrálech:

Li G je jakákoli skutečně měřitelná měřitelná funkce a ${ textstyle varphi}$ je konvexní v rozsahu G, pak

{ displaystyle varphi left ( int _ {- infty} ^ { infty} g (x) f (x) , dx right) leq int _ {- infty} ^ { infty} varphi (g (x)) f (x) , dx.}

Li G(X) = X, pak se tato forma nerovnosti redukuje na běžně používaný speciální případ:

{ displaystyle varphi left ( int _ {- infty} ^ { infty} x , f (x) , dx right) leq int _ {- infty} ^ { infty} varphi (x) , f (x) , dx.}

Toto se používá v Variační Bayesovské metody.

Příklad: sudý momenty náhodné proměnné

Li G(X) = X²ⁿ, a X je tedy náhodná proměnná G je konvexní jako

{ displaystyle { frac {d ^ {2} g} {dx ^ {2}}} (x) = 2n (2n-1) x ^ {2n-2} geq 0 quad forall x in mathbb {R}}

a tak

{ displaystyle g ( operatorname {E} [X]) = ( operatorname {E} [X]) ^ {2n} leq operatorname {E} [X ^ {2n}].}

Zejména pokud nějaký sudý okamžik 2n z X je konečný, X má konečný průměr. Ukazuje rozšíření tohoto argumentu X má konečné okamžiky každé objednávky ${ displaystyle l in mathbb {N}}$ dělení n.

Alternativní konečná forma

Nechat $Ω = {X 1, ... X n},$ a vzít $μ$ být počítání opatření na $Ω$ , pak se obecná forma redukuje na výpis o částkách:

{ displaystyle varphi left ( sum _ {i = 1} ^ {n} g (x_ {i}) lambda _ {i} right) leq sum _ {i = 1} ^ {n} varphi (g (x_ {i})) lambda _ {i},}

pokud $λ i \geq 0$ a

{ displaystyle lambda _ {1} + cdots + lambda _ {n} = 1.}

Existuje také nekonečná diskrétní forma.

Statistická fyzika

Jensenova nerovnost má zvláštní význam ve statistické fyzice, když je konvexní funkce exponenciální, což dává:

{ displaystyle e ^ { operatorname {E} [X]} leq operatorname {E} doleva [e ^ {X} doprava],}

Kde očekávané hodnoty jsou s ohledem na některé rozdělení pravděpodobnosti v náhodná proměnná $X$ .

Důkaz je v tomto případě velmi jednoduchý (srov. Chandler, kap. 5.5). Požadovaná nerovnost následuje přímo psaním

{ Displaystyle operatorname {E} left [e ^ {X} right] = e ^ { operatorname {E} [X]} operatorname {E} left [e ^ {X- operatorname {E} [X]} vpravo]}

a poté aplikovat nerovnost $E X \geq 1 + X$ na konečný exponenciál.

Informační teorie

Li $p (X)$ je skutečná hustota pravděpodobnosti pro $X$ , a $q (X)$ je další hustota, pak se použije Jensenova nerovnost pro náhodnou proměnnou $Y (X) = q (X)/ p (X)$ a konvexní funkce $φ (y) = -log (y)$ dává

{ displaystyle operatorname {E} [ varphi (Y)] geq varphi ( operatorname {E} [Y])}

Proto:

{ displaystyle -D (p (x) | q (x)) = int p (x) log left ({ frac {q (x)} {p (x)}} right) , dx leq log left ( int p (x) { frac {q (x)} {p (x)}} , dx right) = log left ( int q (x) , dx right) = 0}

výsledek volal Gibbsova nerovnost.

Ukazuje, že průměrná délka zprávy je minimalizována, pokud jsou kódy přiřazeny na základě skutečných pravděpodobností p spíše než jakákoli jiná distribuce q. Nezáporné množství se nazývá Kullback – Leiblerova divergence z q z p.

Od té doby $-log (X)$ je striktně konvexní funkce pro $X > 0$ , z toho vyplývá, že rovnost platí, když $p (X)$ rovná se $q (X)$ téměř všude.

Rao – Blackwellova věta

Li L je konvexní funkce a ${ displaystyle { mathfrak {G}}}$ sub-sigma-algebra, pak z podmíněné verze Jensenovy nerovnosti dostaneme

{ displaystyle L ( operatorname {E} [ delta (X) mid { mathfrak {G}}]) leq operatorname {E} [L ( delta (X)) mid { mathfrak {G }}] quad Longrightarrow quad operatorname {E} [L ( operatorname {E} [ delta (X) mid { mathfrak {G}}])]] leq operatorname {E} [L ( delta (X))].}

Takže pokud δ (X) je nějaký odhadce nepozorovaného parametru θ vzhledem k vektoru pozorovatelných X; a pokud T(X) je dostatečná statistika pro θ; pak vylepšený odhadce ve smyslu menší očekávané ztráty L, lze získat výpočtem

{ displaystyle delta _ {1} (X) = operatorname {E} _ { theta} [ delta (X ') mid T (X') = T (X)],}

očekávaná hodnota δ vzhledem k θ převzatá všemi možnými vektory pozorování X kompatibilní se stejnou hodnotou T(X) jak bylo pozorováno. Dále, protože T je dostatečná statistika, ${ displaystyle delta _ {1} (X)}$ nezávisí na θ, proto se stává statistikou.

Tento výsledek je znám jako Rao – Blackwellova věta.

Viz také

Karamatova nerovnost pro obecnější nerovnost
Popoviciuova nerovnost
Zákon průměrů
Důkaz beze slov o Jensenově nerovnosti

Poznámky

^ Jensen, J. L. W. V. (1906). "Sur les fonctions convexes et les inégalités entre les valeurs moyennes". Acta Mathematica. 30 (1): 175–193. doi:10.1007 / BF02418571.
^ Gao, Xiang; Sitharam, Meera; Roitberg, Adrian (2019). „Hranice mezery Jensen a důsledky pro průměrně koncentrované distribuce“ (PDF). Australian Journal of Mathematical Analysis and Applications. 16 (2). arXiv:1712.05267.
^ Niculescu, Constantin P. „Integrální nerovnosti“, Str. 12.
^ Upozornění: V této obecnosti jsou zapotřebí další předpoklady o konvexní funkci a / nebo topologickém vektorovém prostoru, viz Příklad (1.3) na str. 53 palců Perlman, Michael D. (1974). „Jensenova nerovnost pro konvexní funkci s vektorem v nekonečně dimenzionálním prostoru“. Journal of Multivariate Analysis. 4 (1): 52–65. doi:10.1016 / 0047-259X (74) 90005-0.
^ Liao, J .; Berg, A (2018). „Ostření Jensenovy nerovnosti“. Americký statistik. arXiv:1707.08644. doi:10.1080/00031305.2017.1419145.
^ Bradley, CJ (2006). Úvod do nerovností. Leeds, Velká Británie: United Kingdom Mathematics Trust. str. 97. ISBN 978-1-906001-11-7.

Reference

David Chandler (1987). Úvod do moderní statistické mechaniky. Oxford. ISBN 0-19-504277-8.
Tristan Needham (1993) „Vizuální vysvětlení Jensenovy nerovnosti“, Americký matematický měsíčník 100(8):768–71.
Nicola Fusco; Paolo Marcellini; Carlo Sbordone (1996). Analisi Matematica Due. Liguori. ISBN 978-88-207-2675-1.
Walter Rudin (1987). Skutečná a komplexní analýza. McGraw-Hill. ISBN 0-07-054234-1.

externí odkazy

Nerovnost operátora Jensena Hansena a Pedersena.
„Jensenova nerovnost“, Encyclopedia of Mathematics, Stiskněte EMS, 2001 [1994]
Weisstein, Eric W. „Jensenova nerovnost“. MathWorld.
Arthur Lohwater (1982). „Úvod do nerovností“. Online elektronická kniha ve formátu PDF.

[1] Jensen, J. L. W. V. (1906). "Sur les fonctions convexes et les inégalités entre les valeurs moyennes". Acta Mathematica. 30 (1): 175–193. doi:10.1007 / BF02418571.

[Gao_et_al.-2] Gao, Xiang; Sitharam, Meera; Roitberg, Adrian (2019). „Hranice mezery Jensen a důsledky pro průměrně koncentrované distribuce“ (PDF). Australian Journal of Mathematical Analysis and Applications. 16 (2). arXiv:1712.05267.

[3] Niculescu, Constantin P. „Integrální nerovnosti“, Str. 12.

[4] Upozornění: V této obecnosti jsou zapotřebí další předpoklady o konvexní funkci a / nebo topologickém vektorovém prostoru, viz Příklad (1.3) na str. 53 palců Perlman, Michael D. (1974). „Jensenova nerovnost pro konvexní funkci s vektorem v nekonečně dimenzionálním prostoru“. Journal of Multivariate Analysis. 4 (1): 52–65. doi:10.1016 / 0047-259X (74) 90005-0.

[Liao_&_Berg-5] Liao, J .; Berg, A (2018). „Ostření Jensenovy nerovnosti“. Americký statistik. arXiv:1707.08644. doi:10.1080/00031305.2017.1419145.

[6] Bradley, CJ (2006). Úvod do nerovností. Leeds, Velká Británie: United Kingdom Mathematics Trust. str. 97. ISBN 978-1-906001-11-7.

[1]

[2]

[3]

[4]

[5]

[6]