Geometrický medián - Geometric median - Wikipedia

The geometrický medián diskrétní sady vzorkovacích bodů v a Euklidovský prostor je bod minimalizující součet vzdáleností k bodům vzorkování. Tím se zobecňuje medián, který má vlastnost minimalizace součtu vzdáleností pro jednorozměrná data a poskytuje a centrální tendence ve vyšších dimenzích. To je také známé jako 1-medián,[1] prostorový medián,[2] Euklidovský minisumový bod,[2] nebo Torricelliho bod.[3]
Geometrický medián je důležitý odhadce z umístění ve statistikách,[4] kde je také známý jako L1 odhadce.[5] Je to také standardní problém v umístění zařízení, kde modeluje problém lokalizace zařízení, aby se minimalizovaly náklady na dopravu.[6]
Zvláštní případ úlohy pro tři body v rovině (tj. m = 3 a n = 2 v níže uvedené definici) je někdy také známý jako Fermatův problém; vzniká při konstrukci minima Steinerovy stromy, a původně byl považován za problém uživatelem Pierre de Fermat a vyřešil Evangelista Torricelli.[7] Jeho řešení je nyní známé jako Fermatův bod trojúhelníku tvořeného třemi body vzorkování.[8] Geometrický medián lze zase zobecnit na problém minimalizace součtu vážený vzdálenosti, známé jako Weberův problém po Alfred Weber pojednání o problému v jeho knize o umístění zařízení z roku 1909.[2] Některé zdroje místo toho nazývají Weberův problém problémem Fermat-Weber,[9] ale ostatní používají tento název pro nevážený geometrický mediánový problém.[10]
Wesolowsky (1993) poskytuje přehled geometrického mediánu problému. Vidět Fekete, Mitchell & Beurer (2005) pro zobecnění problému na diskrétní množiny bodů.
Definice
Formálně pro danou sadu m bodů s každým , geometrický medián je definován jako
Tady, arg min znamená hodnotu argumentu což minimalizuje součet. V tomto případě jde o věc odkud je součet všech Euklidovské vzdálenosti do je minimální.
Vlastnosti
- U jednorozměrného případu se geometrický medián shoduje s medián. Je to proto, že univariate medián také minimalizuje součet vzdáleností od bodů.[11]
- Geometrický medián je unikátní kdykoli body nejsou kolineární.[12]
- Geometrický medián je ekvivariant pro euklidovský transformace podobnosti, počítaje v to překlad a otáčení.[5][11] To znamená, že by člověk získal stejný výsledek buď transformací geometrického mediánu, nebo aplikací stejné transformace na ukázková data a nalezení geometrického mediánu transformovaných dat. Tato vlastnost vyplývá ze skutečnosti, že geometrický medián je definován pouze z párových vzdáleností a nezávisí na systému ortogonálních Kartézské souřadnice kterým jsou reprezentována ukázková data. Naproti tomu medián jednotlivých komponent pro mnohorozměrný datový soubor není obecně invariantní rotací ani nezávislý na volbě souřadnic.[5]
- Geometrický medián má a bod poruchy 0,5.[5] To znamená, že až polovina údajů o vzorku může být libovolně poškozena a medián vzorků bude i nadále poskytovat robustní odhad pro umístění nepoškozených dat.
Speciální případy
- Pro 3 (ne-kolineární ) body, pokud je jakýkoli úhel trojúhelníku tvořeného těmito body 120 ° nebo více, pak geometrický medián je bod na vrcholu tohoto úhlu. Pokud jsou všechny úhly menší než 120 °, je geometrickým středem bod uvnitř trojúhelníku, který svírá úhel 120 ° s každým třem párem vrcholů trojúhelníku.[11] Toto je také známé jako Fermatův bod trojúhelníku tvořeného třemi vrcholy. (Pokud jsou tři body kolineární, pak geometrický medián je bod mezi dvěma dalšími body, jako je tomu u jednorozměrného mediánu.)
- Pro 4 koplanární body, pokud je jeden ze čtyř bodů uvnitř trojúhelníku tvořeného dalšími třemi body, pak geometrický medián je tento bod. Jinak čtyři body tvoří konvexní čtyřúhelník a geometrický medián je bodem křížení úhlopříček čtyřúhelníku. Geometrický medián čtyř koplanárních bodů je stejný jako jedinečný Radonový bod ze čtyř bodů.[13]
Výpočet
Navzdory tomu, že geometrický medián je snadno srozumitelný koncept, výpočet představuje výzvu. The těžiště nebo těžiště, definovaný podobně jako geometrický medián jako minimalizace součtu čtverce vzdáleností ke každému bodu lze zjistit pomocí jednoduchého vzorce - jeho souřadnice jsou průměrem souřadnic bodů - ale ukázalo se, že žádný explicitní vzorec, ani přesný algoritmus zahrnující pouze aritmetické operace a kth kořeny, mohou existovat obecně pro geometrický medián. Proto jsou v tomto rámci možné pouze numerické nebo symbolické aproximace řešení tohoto problému model výpočtu.[14]
Je však jednoduché vypočítat aproximaci geometrického mediánu pomocí iteračního postupu, při kterém každý krok vytvoří přesnější aproximaci. Postupy tohoto typu lze odvodit ze skutečnosti, že součet vzdáleností k bodům odběru je a konvexní funkce, protože vzdálenost do každého vzorkovaného bodu je konvexní a součet konvexních funkcí zůstává konvexní. Proto postupy, které snižují součet vzdáleností v každém kroku, nemohou být zachyceny v a místní optimum.
Jeden společný přístup tohoto typu, tzv Weiszfeldův algoritmus po práci Endre Weiszfeld,[15] je forma iterativně znovu zváženo nejméně čtverců. Tento algoritmus definuje množinu vah, které jsou nepřímo úměrné vzdálenostem od aktuálního odhadu k bodům vzorkování, a vytváří nový odhad, který je váženým průměrem vzorku podle těchto vah. To znamená
Tato metoda konverguje téměř ke všem počátečním pozicím, ale nemusí konvergovat, když jeden z jejích odhadů spadne na jeden z daných bodů. Může být upraven tak, aby zvládl tyto případy tak, aby konvergoval pro všechny počáteční body.[12]
Bose, Maheshwari & Morin (2003) popsat složitější postupy geometrické optimalizace pro nalezení přibližně optimálního řešení tohoto problému. Tak jako Nie, Parrilo & Sturmfels (2008) ukázat, problém lze také vyjádřit jako a semidefinitní program.
Cohen a kol. (2016) ukázat, jak vypočítat geometrický medián s libovolnou přesností téměř lineární čas.
Charakterizace geometrického mediánu
Li y je odlišný od všech daných bodů, Xj, pak y je geometrický medián, jen když splňuje:
To odpovídá:
což úzce souvisí s Weiszfeldovým algoritmem.
Obecně, y je geometrický medián právě tehdy, pokud existují vektory uj takové, že:
kde pro Xj ≠ y,
a pro Xj = y,
Ekvivalentní formulace tohoto stavu je
Lze jej chápat jako zevšeobecnění mediánové vlastnosti v tom smyslu, že jakékoli rozdělení bodů, zejména vyvolané jakoukoli nadrovinou prostřednictvím y, má stejný a opačný součet kladných hodnot Pokyny z y na každé straně. V jednorozměrném případě je hyperplánem bod y sama o sobě a součet směrů se zjednodušuje na (směrovanou) míru počítání.
Zobecnění
Geometrický medián lze zobecnit z euklidovských prostorů na obecné Riemannovy rozdělovače (a dokonce metrické prostory ) používající stejnou myšlenku, která se používá k definování Fréchet znamená na Riemannově potrubí.[16] Nechat být Riemannovo potrubí s odpovídající funkcí vzdálenosti , nechť být závaží se součtem 1, a nechat být pozorování od . Poté definujeme vážený geometrický medián (nebo vážený Fréchetův medián) datových bodů jako
- .
Pokud jsou všechny váhy stejné, řekneme to jednoduše je geometrický medián.
Viz také
Poznámky
- ^ Obecnější k-mediánský problém žádá o umístění k centra klastrů minimalizující součet vzdáleností od každého bodu vzorku k jeho nejbližšímu středu.
- ^ A b C Drezner a kol. (2002)
- ^ Cieslik (2006).
- ^ Lawera & Thompson (1993).
- ^ A b C d Lopuhaä & Rousseeuw (1991)
- ^ Eiselt a Marianov (2011).
- ^ Krarup & Vajda (1997).
- ^ Španělsko (1996).
- ^ Brimberg (1995).
- ^ Bose, Maheshwari & Morin (2003).
- ^ A b C Haldane (1948)
- ^ A b Vardi & Zhang (2000)
- ^ Cieslik (2006), str. 6; Plastria (2006). Konvexní případ původně prokázal Giovanni Fagnano.
- ^ Bajaj (1986); Bajaj (1988). Dříve, Cockayne & Melzak (1969) dokázal, že Steinerův bod pro 5 bodů v rovině nelze konstruovat pomocí pravítko a kompas
- ^ Weiszfeld (1937); Kuhn (1973); Chandrasekaran & Tamir (1989).
- ^ Fletcher, Venkatasubramanian & Joshi (2009).
Reference
- Bajaj, C. (1986). "Prokázání neřešitelnosti geometrických algoritmů: Aplikace factoringových polynomů". Journal of Symbolic Computation. 2: 99–102. doi:10.1016 / S0747-7171 (86) 80015-3.CS1 maint: ref = harv (odkaz)
- Bajaj, C. (1988). „Algebraický stupeň problémů s geometrickou optimalizací“. Diskrétní a výpočetní geometrie. 3 (2): 177–191. doi:10.1007 / BF02187906.CS1 maint: ref = harv (odkaz)
- Bose, Prosenjit; Maheshwari, Anil; Morin, Pat (2003). „Rychlá aproximace pro součty vzdáleností, shlukování a problém Fermat – Weber“. Výpočetní geometrie: Teorie a aplikace. 24 (3): 135–146. doi:10.1016 / S0925-7721 (02) 00102-5.CS1 maint: ref = harv (odkaz)
- Brimberg, J. (1995). „Problém s umístěním Fermat – Weber se vrátil“. Matematické programování. 71 (1, ser. A): 71–76. doi:10.1007 / BF01592245. PAN 1362958. S2CID 206800756.CS1 maint: ref = harv (odkaz)
- Chandrasekaran, R .; Tamir, A. (1989). "Otevřené otázky týkající se Weiszfeldova algoritmu pro problém s umístěním Fermat-Webera". Matematické programování. Řada A. 44 (1–3): 293–295. doi:10.1007 / BF01587094. S2CID 43224801.CS1 maint: ref = harv (odkaz)
- Cieslik, Dietmar (2006). Nejkratší konektivita: Úvod do aplikací ve fylogenezi. Kombinatorická optimalizace. 17. Springer. str. 3. ISBN 9780387235394.CS1 maint: ref = harv (odkaz)
- Cockayne, E. J .; Melzak, Z. A. (1969). "Euklidovská konstruovatelnost v problémech minimalizace grafů". Matematický časopis. 42 (4): 206–208. doi:10.2307/2688541. JSTOR 2688541.CS1 maint: ref = harv (odkaz)
- Cohen, Michael; Lee, Yin Tat; Miller, Gary; Pachocki, Jakub; Sidford, Aaron (2016). "Geometrický medián v téměř lineárním čase" (PDF). Proc. 48. symposium o teorii práce na počítači (STOC 2016). Sdružení pro výpočetní techniku. arXiv:1606.05225. doi:10.1145/2897518.2897647.
- Drezner, Zvi; Klamroth, Kathrin; Schöbel, Anita; Wesolowsky, George O. (2002). „Weberův problém“. Umístění zařízení: Aplikace a teorie. Springer, Berlín. s. 1–36. ISBN 9783540213451. PAN 1933966.CS1 maint: ref = harv (odkaz)
- Eiselt, H. A .; Marianov, Vladimir (2011). Základy analýzy polohy. International Series in Operations Research & Management Science. 155. Springer. str. 6. ISBN 9781441975720.CS1 maint: ref = harv (odkaz)
- Fekete, Sándor P .; Mitchell, Joseph S. B.; Beurer, Karin (2005). „K trvalému problému Fermat-Weber“. Operační výzkum. 53 (1): 61–76. arXiv:cs.CG/0310027. doi:10.1287 / opre.1040.0137. S2CID 1121.CS1 maint: ref = harv (odkaz)
- Fletcher, P. Thomas; Venkatasubramanian, Suresh; Joshi, Sarang (2009). „Geometrický medián na Riemannovských varietách s aplikací na robustní odhad atlasu“. NeuroImage. 45 (1 příplatek): s143 – s152. doi:10.1016 / j.neuroimage.2008.10.052. PMC 2735114. PMID 19056498.CS1 maint: ref = harv (odkaz)
- Haldane, J. B. S. (1948). Msgstr "Poznámka k mediánu vícerozměrné distribuce". Biometrika. 35 (3–4): 414–417. doi:10.1093 / biomet / 35,3-4,414.CS1 maint: ref = harv (odkaz)
- Krarup, Jakob; Vajda, Steven (1997). "Na Torricelliho geometrické řešení problému Fermata". IMA Journal of Mathematics Applied in Business and Industry. 8 (3): 215–224. doi:10.1093 / imaman / 8.3.215. PAN 1473041.CS1 maint: ref = harv (odkaz)
- Kuhn, Harold W. (1973). "Poznámka k Fermatovu problému". Matematické programování. 4 (1): 98–107. doi:10.1007 / BF01584648. S2CID 22534094.CS1 maint: ref = harv (odkaz)
- Lawera, Martin; Thompson, James R. (1993). "Některé problémy odhadu a testování ve vícerozměrném statistickém řízení procesu". Sborník 38. konference o designu experimentů. Zpráva Úřadu pro výzkum armády USA. 93–2. 99–126.CS1 maint: ref = harv (odkaz)
- Lopuhaä, Hendrick P .; Rousseeuw, Peter J. (1991). „Body rozdělení afinních ekvivariačních odhadů vícerozměrných lokačních a kovariančních matic“. Annals of Statistics. 19 (1): 229–248. doi:10.1214 / aos / 1176347978. JSTOR 2241852.CS1 maint: ref = harv (odkaz)
- Nie, Jiawang; Parrilo, Pablo A .; Sturmfels, Bernd (2008). "Semidefinitní reprezentace k-ellipse ". In Dickenstein, A .; Schreyer, F.O.; Sommese, A.J. (eds.). Algoritmy v algebraické geometrii. Svazky IMA v matematice a její aplikace. 146. Springer-Verlag. 117–132. arXiv:matematika / 0702005. Bibcode:Matematika 2007 ...... 2005N. doi:10.1007/978-0-387-75155-9_7. S2CID 16558095.CS1 maint: ref = harv (odkaz)
- Ostresh, L. (1978). "Konvergence třídy iteračních metod pro řešení problému s umístěním Webera". Operační výzkum. 26 (4): 597–609. doi:10,1287 / opre.26.4.597.CS1 maint: ref = harv (odkaz)
- Plastria, Frank (2006). „Byly znovu navštíveny problémy se čtyřbodovým umístěním Fermatu. Nové důkazy a rozšíření starých výsledků“ (PDF). IMA Journal of Management Mathematics. 17 (4): 387–396. doi:10.1093 / imaman / dpl007. Zbl 1126.90046.CS1 maint: ref = harv (odkaz).
- Španělsko, P. G. (1996). „Fermatový bod trojúhelníku“. Matematický časopis. 69 (2): 131–133. doi:10.1080 / 0025570X.1996.11996409. JSTOR 2690672? Origin = pubexport. PAN 1573157.CS1 maint: ref = harv (odkaz)
- Vardi, Jehuda; Zhang, Cun-Hui (2000). „Vícerozměrný L1-medián a související hloubka dat ". Sborník Národní akademie věd Spojených států amerických. 97 (4): 1423–1426 (elektronická verze). Bibcode:2000PNAS ... 97.1423V. doi:10.1073 / pnas.97.4.1423. PAN 1740461. PMC 26449. PMID 10677477.CS1 maint: ref = harv (odkaz)
- Weber, Alfred (1909). Über den Standort der Industrien, Erster Teil: Reine Theorie des Standortes. Tübingen: Mohr.CS1 maint: ref = harv (odkaz)
- Wesolowsky, G. (1993). „Weberův problém: historie a perspektiva“. Věda o poloze. 1: 5–23.CS1 maint: ref = harv (odkaz)
- Weiszfeld, E. (1937). „Sur le point pour lequel la somme des distances de n body donnes est minimum ". Matematický deník Tohoku. 43: 355–386.CS1 maint: ref = harv (odkaz)