v směrová statistika , von Mises – Fisherova distribuce (pojmenoval podle Ronald Fisher a Richard von Mises ), je rozdělení pravděpodobnosti na ( p − 1 ) {displaystyle (p-1)} -koule v R p {displaystyle mathbb {R} ^ {p}} . Li p = 2 {displaystyle p = 2} distribuce se snižuje na von Misesova distribuce na kruh .
The hustota pravděpodobnosti funkce distribuce von Mises – Fisher pro náhodný p -dimenzionální jednotkový vektor X {displaystyle mathbf {x},} je dána:
F p ( X ; μ , κ ) = C p ( κ ) exp ( κ μ T X ) , {displaystyle f_ {p} (mathbf {x}; {oldsymbol {mu}}, kappa) = C_ {p} (kappa) exp left ({kappa {oldsymbol {mu}} ^ {T} mathbf {x}} večer ),} kde κ ≥ 0 , ‖ μ ‖ = 1 {displaystyle kappa geq 0, leftVert {oldsymbol {mu}} ightVert = 1,} a normalizační konstanta C p ( κ ) {displaystyle C_ {p} (kappa),} je rovný
C p ( κ ) = κ p / 2 − 1 ( 2 π ) p / 2 Já p / 2 − 1 ( κ ) , {displaystyle C_ {p} (kappa) = {frac {kappa ^ {p / 2-1}} {(2pi) ^ {p / 2} I_ {p / 2-1} (kappa)}},} kde Já proti {displaystyle I_ {v}} označuje upravené Besselova funkce prvního druhu na objednávku proti {displaystyle v} . Li p = 3 {displaystyle p = 3} normalizační konstanta klesá na
C 3 ( κ ) = κ 4 π sinh κ = κ 2 π ( E κ − E − κ ) . {displaystyle C_ {3} (kappa) = {frac {kappa} {4pi sinh kappa}} = {frac {kappa} {2pi (e ^ {kappa} -e ^ {- kappa})}}}} Parametry μ {displaystyle {oldsymbol {mu}},} a κ {displaystyle kappa,} se nazývají průměrný směr a parametr koncentrace , resp. Čím větší je hodnota κ {displaystyle kappa,} , čím vyšší je koncentrace distribuce kolem středního směru μ {displaystyle {oldsymbol {mu}},} . Distribuce je unimodální pro κ > 0 {displaystyle kappa> 0,} , a je jednotný ve sféře pro κ = 0 {displaystyle kappa = 0,} .
Distribuce von Mises – Fisher pro p = 3 {displaystyle p = 3} , nazývaná také Fisherova distribuce, byla poprvé použita k modelování interakce elektrické dipóly v elektrické pole (Mardia & Jupp, 1999). Další aplikace najdete v geologie , bioinformatika , a dolování textu .
Vztah k normálnímu rozdělení Počínaje a normální distribuce
G p ( X ; μ , κ ) = ( κ 2 π ) p exp ( − κ ( X − μ ) 2 2 ) , {displaystyle G_ {p} (mathbf {x}; {oldsymbol {mu}}, kappa) = left ({sqrt {frac {kappa} {2pi}}} ight) ^ {p} exp left (-kappa {frac { (mathbf {x} - {oldsymbol {mu}}) ^ {2}} {2}} ight),} distribuce von Mises-Fisher se získá rozšířením
( X − μ ) 2 = X 2 + μ 2 − 2 μ T X , {displaystyle (mathbf {x} - {oldsymbol {mu}}) ^ {2} = mathbf {x} ^ {2} + {oldsymbol {mu}} ^ {2} -2 {oldsymbol {mu}} ^ {T } mathbf {x},} díky tomu, že X {displaystyle mathbf {x}} a μ {displaystyle {oldsymbol {mu}}} jsou jednotkové vektory a přepočet normalizační konstanty integrací X {displaystyle mathbf {x}} přes jednotkovou sféru.
Odhad parametrů Série N nezávislý Měření X i {displaystyle x_ {i}} jsou čerpány z distribuce von Mises – Fisher. Definovat
A p ( κ ) = Já p / 2 ( κ ) Já p / 2 − 1 ( κ ) . {displaystyle A_ {p} (kappa) = {frac {I_ {p / 2} (kappa)} {I_ {p / 2-1} (kappa)}}.,} Poté (Mardia & Jupp, 1999) maximální pravděpodobnost odhady μ {displaystyle mu,} a κ {displaystyle kappa,} jsou dány dostatečná statistika
X ¯ = 1 N ∑ i N X i , {displaystyle {ar {x}} = {frac {1} {N}} součet _ {i} ^ {N} x_ {i},} tak jako
μ = X ¯ / R ¯ , kde R ¯ = ‖ X ¯ ‖ , {displaystyle mu = {ar {x}} / {ar {R}}, {ext {where}} {ar {R}} = | {ar {x}} |,} a
κ = A p − 1 ( R ¯ ) . {displaystyle kappa = A_ {p} ^ {- 1} ({ar {R}}).} Tím pádem κ {displaystyle kappa,} je řešením
A p ( κ ) = ‖ ∑ i N X i ‖ N = R ¯ . {displaystyle A_ {p} (kappa) = {frac {| sum _ {i} ^ {N} x_ {i} |} {N}} = {ar {R}}.} Jednoduchá aproximace na κ {displaystyle kappa} is (Sra, 2011)
κ ^ = R ¯ ( p − R ¯ 2 ) 1 − R ¯ 2 , {displaystyle {hat {kappa}} = {frac {{ar {R}} (p- {ar {R}} ^ {2})} {1- {ar {R}} ^ {2}}},} ale přesnější měřítko lze získat opakováním Newtonovy metody několikrát
κ ^ 1 = κ ^ − A p ( κ ^ ) − R ¯ 1 − A p ( κ ^ ) 2 − p − 1 κ ^ A p ( κ ^ ) , {displaystyle {hat {kappa}} _ {1} = {hat {kappa}} - {frac {A_ {p} ({hat {kappa}}) - {ar {R}}} {1-A_ {p} ({hat {kappa}}) ^ {2} - {frac {p-1} {hat {kappa}}} A_ {p} ({hat {kappa}})}}}} κ ^ 2 = κ ^ 1 − A p ( κ ^ 1 ) − R ¯ 1 − A p ( κ ^ 1 ) 2 − p − 1 κ ^ 1 A p ( κ ^ 1 ) . {displaystyle {hat {kappa}} _ {2} = {hat {kappa}} _ {1} - {frac {A_ {p} ({hat {kappa}} _ {1}) - {ar {R}} } {1-A_ {p} ({hat {kappa}} _ {1}) ^ {2} - {frac {p-1} {{hat {kappa}} _ {1}}} A_ {p} ( {hat {kappa}} _ {1})}}.} Pro N ≥ 25 lze odhadnout sférickou standardní chybu středního směru vzorku vypočítat jako[1]
σ ^ = ( d N R ¯ 2 ) 1 / 2 {displaystyle {hat {sigma}} = left ({frac {d} {N {ar {R}} ^ {2}}} ight) ^ {1/2}} kde
d = 1 − 1 N ∑ i N ( μ T X i ) 2 {displaystyle d = 1- {frac {1} {N}} součet _ {i} ^ {N} (mu ^ {T} x_ {i}) ^ {2}} Pak je možné aproximovat a 100 ( 1 − α ) % {displaystyle 100 (1-alfa) \%} důvěra kužel o μ {displaystyle mu} s polosvislým úhlem
q = arcsin ( E α 1 / 2 σ ^ ) , {displaystyle q = arcsin (e_ {alpha} ^ {1/2} {hat {sigma}}),} kde E α = − ln ( α ) . {displaystyle e_ {alpha} = - ln (alfa).} Například pro kužel spolehlivosti 95%, α = 0.05 , E α = − ln ( 0.05 ) = 2.996 , {displaystyle alpha = 0,05, e_ {alpha} = - ln (0,05) = 2,996,} a tudíž q = arcsin ( 1.731 σ ^ ) . {displaystyle q = arcsin (1.731 {hat {sigma}}).}
Zobecnění Matice von Mises-Fisherova distribuce má hustotu
F n , p ( X ; F ) ∝ exp ( tr ( F T X ) ) {displaystyle f_ {n, p} (mathbf {X}; mathbf {F}) propto exp (operatorname {tr} (mathbf {F} ^ {T} mathbf {X}))} podporováno na Stiefel potrubí z n × p {displaystyle n imes p} ortonormální p-snímky X {displaystyle mathbf {X}} , kde F {displaystyle mathbf {F}} je libovolný n × p {displaystyle n imes p} skutečná matice.[2] [3]
Viz také Reference Dhillon, I., Sra, S. (2003) „Modelování dat pomocí směrových distribucí“. Tech. rep., University of Texas, Austin. Banerjee, A., Dhillon, I. S., Ghosh, J., & Sra, S. (2005). "Shlukování na jednotkové hypersféře pomocí distribucí von Mises-Fisher". Journal of Machine Learning Research, 6 (září), 1345-1382. Fisher, RA, „Disperze na kouli“. (1953) Proc. Roy. Soc. London Ser. A. , 217: 295–305 Mardia, Kanti ; Jupp, P. E. (1999). Směrová statistika . John Wiley & Sons Ltd. ISBN 978-0-471-95333-3 .Sra, S. (2011). "Krátká poznámka k aproximaci parametrů pro distribuce von Mises-Fisher: A rychlá implementace I s (x)". Výpočetní statistika . 27 : 177–190. CiteSeerX 10.1.1.186.1887 . doi :10.1007 / s00180-011-0232-x . Diskrétní univariate s konečnou podporou Diskrétní univariate s nekonečnou podporou Kontinuální univariate podporováno v omezeném intervalu Kontinuální univariate podporováno v poloneomezeném intervalu Kontinuální univariate podporováno na celé reálné linii Kontinuální univariate s podporou, jejíž typ se liší Smíšené spojité diskrétní univariate Vícerozměrný (společný) Směrový Degenerovat a jednotné číslo Rodiny