Nezakořeněný binární strom - Unrooted binary tree

A kladogram ve formě nezakořeněného binárního stromu, který představuje podobnosti a evoluční historii mezi druhy aktinobakterie.

V matematice a informatice, an nekořenovaný binární strom je nezakořeněný strom ve kterém každý vrchol má jednoho nebo tři sousedy.

Definice

A strom zdarma nebo nezakořeněný strom je připojeno neorientovaný graf bez č cykly. Vrcholy s jedním sousedem jsou listy stromu a zbývající vrcholy jsou vnitřní uzly stromu. The stupeň vrcholu je jeho počet sousedů; ve stromu s více než jedním uzlem jsou listy vrcholy prvního stupně. Nezakořeněný binární strom je volný strom, ve kterém mají všechny vnitřní uzly stupeň přesně tři.

V některých aplikacích může mít smysl rozlišovat podtypy nezakořeněných binárních stromů: a rovinné vkládání stromu lze opravit stanovením cyklického uspořádání hran na každém vrcholu, čímž se vytvoří a platan. V počítačové vědě jsou binární stromy často zakořeněny a uspořádány, když jsou používány jako datové struktury, ale v aplikacích nezakořeněných binárních stromů ve Windows hierarchické shlukování a evoluční strom rekonstrukce, neuspořádané stromy jsou častější.[1]

Navíc lze rozlišovat mezi stromy, ve kterých mají všechny vrcholy odlišné štítky, stromy, ve kterých jsou označeny pouze listy, a stromy, ve kterých nejsou označeny uzly. V nezakořeněném binárním stromu s n listí, bude n - 2 vnitřní uzly, takže štítky lze převzít ze sady celých čísel od 1 do 2n - 1, pokud mají být označeny všechny uzly, nebo ze sady celých čísel od 1 do n když mají být označeny pouze listy.[1]

Související struktury

Zakořeněné binární stromy

Nezakořeněný binární strom T mohou být transformovány do plně zakořeněné binární strom (tj. kořenový strom, ve kterém má každý nelistový uzel přesně dvě děti) výběrem a kořenová hrana E z T, umístění nového kořenového uzlu uprostřed Ea směrování každého okraje výsledného rozděleného stromu směrem od kořenového uzlu. Naopak jakýkoli plně zakořeněný binární strom lze transformovat na nekořenovaný binární strom odstraněním kořenového uzlu, nahrazením cesty mezi jeho dvěma podřízenými jedinou neorientovanou hranou a potlačením orientace zbývajících hran v grafu. Z tohoto důvodu existují přesně 2n −3krát tolik plně zakořeněných binárních stromů n listy, protože existují nezakořeněné binární stromy s n listy.[1]

Hierarchické shlukování

A hierarchické shlukování sbírky předmětů lze formalizovat jako a maximální rodina sad objektů, ve kterých se neprotínají žádné dvě sady. To znamená pro každé dvě sady S a T buď v rodině S a T jsou disjunktní nebo jedna je podmnožinou druhé a při zachování této vlastnosti nelze do rodiny přidat žádné další sady. Li T je nezakořeněný binární strom, definuje hierarchické shlukování jeho listů: pro každou hranu (u,proti) v T existuje shluk skládající se z listů, které jsou blíže u než do protia tyto sady spolu s prázdnou sadou a sadou všech listů tvoří maximální nepřekračující rodinu. Naopak z jakékoli maximální nepřekračující rodiny sad přes sadu n prvků lze vytvořit jedinečný nekořenovaný binární strom, který má uzel pro každou trojici (A,B,C) disjunktních množin v rodině, které společně pokrývají všechny prvky.[2]

Evoluční stromy

Podle jednoduchých forem evoluční teorie, historii života lze shrnout jako a fylogenetický strom ve kterém každý uzel popisuje druh, listy představují druhy, které dnes existují, a hrany představují vztahy mezi předky a potomky mezi druhy. Tento strom má přirozenou orientaci od předků po potomky a kořen na společný předek druhu, takže se jedná o zakořeněný strom. Některé metody rekonstrukce binárních stromů však mohou rekonstruovat pouze uzly a hrany tohoto stromu, ale ne jejich orientace.

Například, kladistické metody jako maximální šetrnost použít jako data soubor binárních atributů popisujících vlastnosti druhu. Tyto metody hledají strom s daným druhem jako listy, ve kterém jsou vnitřní uzly také označeny znaky, a pokoušejí se minimalizovat počet výskytů určitého znaku pouze v jednom ze dvou koncových bodů hrany ve stromu. V ideálním případě by každá funkce měla mít pouze jednu hranu, což je tento případ. Změna kořene stromu tento počet okrajových rozdílů nezmění, takže metody založené na šetrnosti nejsou schopné určit umístění kořene stromu a vytvoří nekořenovaný strom, často nekořenovaný binární strom.[3]

Nekořeněné binární stromy jsou také produkovány metodami pro odvození evolučních stromů na základě údajů kvarteta, které pro každý čtyři listový druh specifikují nezakořeněný binární strom popisující vývoj těchto čtyř druhů a metodami, které používají vzdálenost kvarteta změřit vzdálenost mezi stromy.[4]

Rozklad větví

Nezakořeněné binární stromy se také používají k definování větvové rozklady grafů vytvořením nezakořeněného binárního stromu, jehož listy představují okraje daného grafu. To znamená, že rozklad větve lze chápat jako hierarchické shlukování okrajů grafu. Rozvětvené rozklady a související číselná veličina, šířka větve, s tím úzce souvisí šířka stromu a tvoří základ pro efektivní dynamické programování algoritmy na grafech.[5]

Výčet

Díky jejich aplikacím v hierarchickém shlukování jsou nejpřirozenější výčet grafů problém na nezakořeněných binárních stromech je spočítat počet stromů s n označené listy a neoznačené vnitřní uzly. Nezakořeněný binární strom na n označené listy mohou být vytvořeny připojením nlist do nového uzlu uprostřed kteréhokoli z okrajů nezakořeněného binárního stromu n - 1 označené listy. K dispozici jsou 2n - 5 hran, u kterých nmůže být připojen ten uzel; proto počet stromů na n listy jsou větší než počet stromů na n - 1 list o faktor 2n - 5. Tedy počet stromů na n označené listy je dvojitý faktoriál

[6]

Počet stromů na 2, 3, 4, 5, ... označených listech je

1, 1, 3, 15, 105, 945, 10395, 135135, 2027025, 34459425, ... (sekvence A001147 v OEIS ).

Základní ekvity

Délka cesty list-na-list na pevném Unrootovaném binárním stromu (UBT) T kóduje počet hran náležejících k jedinečné cestě v T spojující daný list s jiným listem. Například odkazem na UBT zobrazený na obrázku vpravo, délka cesty mezi listy 1 a 2 se rovná 2, zatímco délka cesty mezi listy 1 a 3 se rovná 3. Sekvence délky cesty od daného listu na pevném UBT T kóduje délky cest od daného listu ke všem zbývajícím. Například odkazem na UBT zobrazený na obrázku vpravo je sekvence délky cesty z listu 1 . Sada sekvencí délky cesty asociovaných s listy T se obvykle označuje jako sběr sekvence délky cesty T. [7].

Příklad nezakořeněného binárního stromu se čtyřmi listy

Daniele Catanzaro, Raffaele Pesenti a Laurence Wolsey ukázal[8] že kolekce sekvencí délky cesty kódující daný UBT s n listy musí splňovat konkrétní rovnosti, a to

  • pro všechny
  • pro všechny
  • pro všechny
  • pro všechny (což je adaptace Kraft – McMillanova nerovnost )
  • , označovaný také jako fylogenetické potrubí[9].

Ukázalo se, že tyto rovnosti jsou nezbytné a nezávislé pro kolekci délky cesty ke kódování UBT s n listy[10]. V současné době není známo, zda jsou také dostatečné.

Alternativní názvy

Byly také povolány nezakořeněné binární stromy zdarma binární stromy,[11] kubické stromy,[12] ternární stromy[5] a nezakořeněné ternární stromy,.[13] Název „bezplatný binární strom“ však byl použit i na nekořenované stromy, které mohou mít uzly druhého stupně[14] a zakořeněné binární stromy s neuspořádanými dětmi,[15] a název „ternární strom“ se častěji používá k označení a kořenový strom se třemi dětmi na uzel.

Poznámky

  1. ^ A b C Furnas (1984).
  2. ^ Viz např. Eppstein (2009) pro stejnou korespondenci mezi shluky a stromy, ale použití kořenových binárních stromů místo nekořenovaných stromů, a tedy včetně libovolné volby kořenového uzlu.
  3. ^ Hendy & Penny (1989).
  4. ^ St. John a kol. (2003).
  5. ^ A b Robertson & Seymour (1991).
  6. ^ Balding, Bishop & Cannings (2007).
  7. ^ Catanzaro D, Pesenti R, Wolsey L (2020). "Na vyrovnaném minimálním vývoji evoluce". Diskrétní optimalizace. 36: 100570. doi:10.1016 / j.disopt.2020.100570.
  8. ^ Catanzaro D, Pesenti R, Wolsey L (2020). "Na vyrovnaném minimálním vývoji evoluce". Diskrétní optimalizace. 36: 100570. doi:10.1016 / j.disopt.2020.100570.
  9. ^ Catanzaro D, Pesenti R, Wolsey L (2020). "Na vyrovnaném minimálním vývoji evoluce". Diskrétní optimalizace. 36: 100570. doi:10.1016 / j.disopt.2020.100570.
  10. ^ Catanzaro D, Pesenti R, Wolsey L (2020). "Na vyrovnaném minimálním vývoji evoluce". Diskrétní optimalizace. 36: 100570. doi:10.1016 / j.disopt.2020.100570.
  11. ^ Czumaj & Gibbons (1996).
  12. ^ Exoo (1996).
  13. ^ Cilibrasi & Vitanyi (2006).
  14. ^ Harary, Palmer & Robinson (1992).
  15. ^ Przytycka & Larmore (1994).

Reference