Obětní beránek strom - Scapegoat tree

Obětní beránek strom
Typstrom
VynalezlArne Andersson, Igal Galperin, Ronald L. Rivest
Časová složitost v velká O notace
AlgoritmusPrůměrnýNejhorší případ
ProstorNa)Na)
VyhledáváníO (log n)O (log n)
VložitO (log n)amortizované O (log n)
VymazatO (log n)amortizované O (log n)

v počítačová věda, a strom obětního beránka je samovyvažující binární vyhledávací strom, vynalezl Arne Andersson[1] a znovu Igal Galperin a Ronald L. Rivest.[2] Poskytuje nejhorší případ Ó (log n) čas vyhledávání a Ó(log n) amortizovaný čas vložení a odstranění.

Na rozdíl od většiny ostatních samovyvažovacích binárních vyhledávacích stromů, které poskytují nejhorší případ Ó(log n) doba vyhledávání, stromy obětních beránků nemají ve srovnání s běžnými žádnou další režii paměti na uzel binární vyhledávací strom: uzel ukládá pouze klíč a dva ukazatele na podřízené uzly. Díky tomu se stromy obětních beránků snáze implementují a kvůli zarovnání datové struktury, může snížit režii uzlů až o jednu třetinu.

Místo malých přírůstkových operací vyvažování používaných většinou vyvážených algoritmů stromů si obětní beránci zřídka, ale nákladně zvolí „obětního beránka“ a zcela přestaví podstrom zakořeněný u obětního beránka na úplný binární strom. Stromy obětních beránků tedy mají Ó(n) nejhorší výkon aktualizace.

Teorie

O binárním vyhledávacím stromu se říká, že je vyvážený, pokud je polovina uzlů nalevo od kořene a polovina napravo. Uzel s vyvážením hmotnosti α je definován jako splňující kritérium uvolněné hmotnosti:

velikost (vlevo) ≤ α * velikost (uzel) velikost (vpravo) ≤ α * velikost (uzel)

Kde lze velikost rekurzivně definovat jako:

funkce velikost (uzel) je    -li uzel = nula pak        vrátit se 0    jiný        vrátit se size (node-> left) + size (node-> right) + 1 skončit, pokudkoncová funkce

Dokonce i zdegenerovaný strom (propojený seznam) splňuje tuto podmínku, pokud α = 1, zatímco α = 0,5 by se shodovalo pouze téměř kompletní binární stromy.

Rovněž musí být binární vyhledávací strom, který je vyvážený s váhou α α-výškově vyvážené, to je

výška (strom) ≤ ⌊log1 / α(velikost (strom)) ⌋

Podle kontrapozice, strom, který není vyvážený ve výšce α, není vyvážený ve váze α.

U stromů obětních beránků není zaručeno, že budou vždy udržovat rovnováhu α-hmotnosti, ale v tom jsou vždy volně vyváženy

výška (strom obětního beránka) ≤ ⌊log1 / α(velikost (strom)) ⌋ + 1.

Porušení této podmínky vyvážení výšky lze zjistit v době vložení, což znamená, že musí existovat porušení podmínky vyvážení hmotnosti.

Díky tomu jsou stromy obětních beránků podobné červeno-černé stromy v tom, že oba mají omezení své výšky. Velmi se liší ve svých implementacích určování, kde dochází k rotacím (nebo v případě stromů obětních beránků, vyvažování). Zatímco červeno-černé stromy ukládají v každém uzlu další „barevné“ informace k určení polohy, stromy obětního beránka najdou a obětní beránek který není vyvážen α-hmotností, aby bylo možné provést operaci vyvážení. To je volně podobné AVL stromy, v tom, že skutečné rotace závisí na „zůstatcích“ uzlů, ale prostředky k určení rovnováhy se velmi liší. Protože stromy AVL kontrolují hodnotu zůstatku při každém vložení / odstranění, je obvykle uložena v každém uzlu; stromy obětního beránka to dokážou vypočítat pouze podle potřeby, což je pouze v případě, že je třeba obětního beránka najít.

Na rozdíl od většiny ostatních samovyvažovacích vyhledávacích stromů jsou stromy obětních beránků zcela flexibilní, pokud jde o jejich vyvažování. Podporují jakýkoli α tak, že 0,5 <α <1. Vysoká hodnota α má za následek méně zůstatků, takže je vkládání rychlejší, ale vyhledávání a mazání pomalejší, a naopak pro nízké α. V praktických aplikacích lze proto zvolit α podle toho, jak často by se tyto akce měly provádět.

Operace

Vzhlédnout

Vyhledávání se nemění ze standardního binárního vyhledávacího stromu a má nejhorší čas O (log n). To je v rozporu s roztáhnout stromy které mají nejhorší dobu O (n). Snížená režie paměti uzlu ve srovnání s jinými samovyvažujícími binárními vyhledávacími stromy se může dále zlepšovat referenční lokalita a ukládání do mezipaměti.

Vložení

Vkládání je implementováno se stejnými základními nápady jako nevyvážený binární vyhledávací strom, avšak s několika významnými změnami.

Při hledání bodu vložení je třeba zaznamenat také hloubku nového uzlu. To je implementováno pomocí jednoduchého čítače, který se zvýší během každé iterace vyhledávání, což efektivně počítá počet hran mezi kořenem a vloženým uzlem. Pokud tento uzel porušuje vlastnost α-height-balance (definováno výše), je nutné provést vyvážení.

K opětovnému vyvážení byl celý podstrom zakořeněn v a obětní beránek prochází vyrovnávací operací. Obětní beránek je definován jako předchůdce vloženého uzlu, který není vyvážený a-váhou. Vždy bude alespoň jeden takový předek. Vyvážením kteréhokoli z nich se obnoví vlastnost vyvážená na výšku α.

Jedním ze způsobů, jak najít obětního beránka, je vylézt z nového uzlu zpět do kořene a vybrat první uzel, který není vyvážený pomocí α-hmotnosti.

Zpětné stoupání ke kořenu vyžaduje O (log n) úložný prostor, obvykle přidělený na zásobníku, nebo nadřazené ukazatele. Tomu se lze skutečně vyhnout tím, že každé dítě nasměrujete na svého rodiče, když jdete dolů, a opravíte ho na procházce zpět.

Abychom zjistili, zda je potenciální uzel životaschopným obětním beránkem, musíme zkontrolovat jeho vlastnost vyváženou a-váhou. K tomu se můžeme vrátit k definici:

velikost (vlevo) ≤ α * velikost (uzel) velikost (vpravo) ≤ α * velikost (uzel)

Velkou optimalizaci však lze provést, když si uvědomíme, že již známe dvě ze tří velikostí, přičemž k výpočtu zbývá pouze třetí.

Zvažte následující příklad, který to demonstruje. Za předpokladu, že stoupáme zpět ke kořenu:

velikost (rodič) = velikost (uzel) + velikost (sourozenec) + 1

Ale jako:

velikost (vložený uzel) = 1.

Případ je bagatelizován na:

velikost [x + 1] = velikost [x] + velikost (sourozenec) + 1

Kde x = tento uzel, x + 1 = rodič a velikost (sourozenec) je jediné požadované volání funkce.

Jakmile je obětní beránek nalezen, podstrom zakořeněný u obětního beránka je zcela přestavěn tak, aby byl dokonale vyvážený.[2] To lze provést v O (n) čas procházením uzlů podstromu, aby byly nalezeny jejich hodnoty v seřazeném pořadí a rekurzivně zvolen medián jako kořen podstromu.

Protože operace vyvážení berou O (n) čas (v závislosti na počtu uzlů podstromu), vložení má nejhorší výkon O (n) čas. Protože jsou však tyto nejhorší scénáře rozloženy, vložení trvá O (log n) amortizovaný čas.

Náčrt důkazu pro náklady na vložení

Definujte nevyváženost uzlu proti být absolutní hodnotou rozdílu ve velikosti mezi jeho levým uzlem a pravým uzlem mínus 1 nebo 0, podle toho, která hodnota je větší. Jinými slovy:

Ihned po přestavbě podstromu zakořeněného na proti, Já (proti) = 0.

Lemma: Bezprostředně před přestavbou podstromu zakořeněného na proti,

( je Velká Omega notace.)

Důkaz lemmatu:

Nechat být kořenem podstromu bezprostředně po přestavbě. . Pokud existují zdegenerované vložení (tj. kde každý vložený uzel zvyšuje výšku o 1), poté
,
a
.

Od té doby před přestavbou tam byly vložení do podstromu zakořeněné na to nevedlo k přestavbě. Každé z těchto vložení lze provést v čas. Konečné vložení, které způsobí náklady na přestavbu . Použitím agregovaná analýza je zřejmé, že naběhlé náklady na vložení jsou :

Vymazání

Stromy obětních beránků jsou neobvyklé v tom, že mazání je snazší než vkládání. Chcete-li povolit odstranění, stromy obětních beránků potřebují uložit další hodnotu se stromovou datovou strukturou. Tato vlastnost, kterou budeme nazývat MaxNodeCount, jednoduše představuje nejvyšší dosažený NodeCount. Je nastaven na NodeCount, kdykoli je znovu vyvážen celý strom, a po vložení je nastaven na max (MaxNodeCount, NodeCount).

Chcete-li provést odstranění, jednoduše odstraníme uzel, jako byste to udělali v jednoduchém binárním vyhledávacím stromu, ale pokud

NodeCount ≤ α * MaxNodeCount

pak znovu vyvážíme celý strom kolem kořene a nezapomeneme nastavit MaxNodeCount na NodeCount.

To dává vypuštění nejhoršího výkonu O (n) čas; je však amortizován na O (log n) průměrný čas.

Náčrt důkazu o nákladech na odstranění

Předpokládejme, že strom obětního beránka má prvky a právě byl přestavěn (jinými slovy je to úplný binární strom). Nejvíce před odstraněním stromu lze provést odstranění. Každá z těchto výmazů trvá čas (doba, po které má být prvek vyhledán a označen jako odstraněný). The odstranění způsobí, že strom bude znovu postaven a zabere (nebo prostě ) čas. Pomocí agregační analýzy je zřejmé, že amortizovaná cena za odstranění je :

Etymologie

Název Obětní beránek strom „[...] je založeno na běžné moudrosti, že když se něco pokazí, první věc, kterou lidé mají tendenci udělat, je najít někoho, kdo by mohl vinit (obětního beránka).“[3] V bible, a obětní beránek je zvíře, které je rituálně zatíženo hříchy ostatních a poté je zahnáno.

Viz také

Reference

  1. ^ Andersson, Arne (1989). Zlepšení částečné přestavby pomocí jednoduchých kritérií vyvážení. Proc. Workshop o algoritmech a datových strukturách. Journal of Algorithms. Springer-Verlag. 393–402. CiteSeerX  10.1.1.138.4859. doi:10.1007/3-540-51542-9_33.
  2. ^ A b Galperin, Igal; Rivest, Ronald L. (1993). Obětní beránky (PDF). Sborník čtvrtého ročníku sympozia ACM-SIAM o diskrétních algoritmech. Philadelphie: Společnost pro průmyslovou a aplikovanou matematiku. str. 165–174. CiteSeerX  10.1.1.309.9376. ISBN  0-89871-313-7.
  3. ^ Morin, Pat. „Kapitola 8 - Stromy obětních beránků“. Otevřené datové struktury (v pseudokódu) (0,1 G β ed.). Citováno 2017-09-16.

externí odkazy