Vyhledejte datovou strukturu - Search data structure

v počítačová věda, a struktura dat vyhledávání[Citace je zapotřebí ] je jakýkoli datová struktura který umožňuje efektivní načítání konkrétních položek z a soubor položek, například konkrétní záznam od a databáze.

Nejjednodušší, nejobecnější a nejméně efektivní struktura vyhledávání je pouze neuspořádaná posloupnost seznam všech položek. Vyhledání požadované položky v takovém seznamu pomocí lineární vyhledávání metoda nevyhnutelně vyžaduje počet operací úměrných počtu n položek v nejhorší případ stejně jako v průměrný případ. Užitečné datové struktury vyhledávání umožňují rychlejší vyhledávání; jsou však omezeny na dotazy nějakého konkrétního druhu. Navíc, protože náklady na stavbu těchto struktur jsou přinejmenším úměrné n, vyplatí se, pouze pokud má být provedeno několik dotazů ve stejné databázi (nebo v databázi, která se mezi dotazy málo mění).

Statický struktury vyhledávání jsou navrženy pro zodpovězení mnoha dotazy na pevné databázi; dynamický struktury také umožňují vkládání, mazání nebo úpravy položek mezi po sobě jdoucími dotazy. V dynamickém případě je také třeba vzít v úvahu náklady na opravu struktury vyhledávání, aby byly zohledněny změny v databázi.

Klasifikace

Nejjednodušší druh dotazu je najít záznam, který má konkrétní pole ( klíč) se rovná zadané hodnotě proti. Další běžné druhy dotazů jsou „najít položku s nejmenší (nebo největší) hodnotou klíče“, „najít položku s největší hodnotou klíče nepřesahující proti"," najít všechny položky s hodnotami klíče mezi zadanými mezemi protimin a protimax".

V některých databázích mohou být klíčové hodnoty v některých bodech vícerozměrný prostor. Klíčem může být například zeměpisná poloha (zeměpisná šířka a zeměpisná délka ) na Země. V takovém případě jsou běžné druhy dotazů najděte záznam s klíčem nejblíže danému bodu proti„,“ nebo „najít všechny položky, jejichž klíč leží v dané vzdálenosti od proti„,“ nebo „vyhledat všechny položky v určené oblasti R prostoru ".

Běžným zvláštním případem posledně jmenovaného jsou simultánní dotazy na rozsah na dva nebo více jednoduchých klíčů, například „najít všechny záznamy zaměstnanců s platem mezi 50 000 a 100 000 a najatými v letech 1995 až 2007“.

Jednotlivé objednané klíče

Nalezení nejmenšího prvku

Asymptotická amortizovaná analýza nejhorších případů

V této tabulce je asymptotické notace Ó(F(n)) znamená "nepřesahující nějaký pevný násobek F(n) v nejhorším případě. “

Datová strukturaVložitVymazatZůstatekZískejte indexVyhledáváníNajděte minimumNajděte maximumVyužití prostoru
Netříděný poleÓ(1)
(viz poznámka)
Ó(1)
(viz poznámka)
N / AÓ(1)Ó(n)Ó(n)Ó(n)Ó(n)
Seřazené poleÓ(n)Ó(n)N / AÓ(1)Ó(logn)Ó(1)Ó(1)Ó(n)
ZásobníkÓ(1)Ó(1)Ó(n)Ó(n)
FrontaÓ(1)Ó(1)Ó(n)Ó(n)
Netříděný spojový seznamÓ(1)Ó(1)[1]N / AÓ(n)Ó(n)Ó(n)Ó(n)Ó(n)
Seřazený propojený seznamÓ(n)Ó(1)[1]N / AÓ(n)Ó(n)Ó(1)Ó(1)Ó(n)
Přeskočit seznam
Samovyvažující binární vyhledávací stromÓ(logn)Ó(logn)Ó(logn)N / AÓ(logn)Ó(logn)Ó(logn)Ó(n)
HaldaÓ(logn)Ó(logn)Ó(logn)N / AÓ(n)Ó(1) pro a min. hromada
Ó(n) pro maximální hromada[2]
Ó(1) pro a maximální hromada
Ó(n) pro min. hromada[2]
Ó(n)
Hašovací stůlÓ(1)Ó(1)Ó(n)N / AÓ(1)Ó(n)Ó(n)Ó(n)
Trie (k = průměrná délka klíče)Ó(k)Ó(k)N / AÓ(k)Ó(k)Ó(k)Ó(k)Ó(k n)
Kartézský strom
B-stromÓ(logn)Ó(logn)Ó(logn)N / AÓ(logn)Ó(logn)Ó(logn)Ó(n)
Červeno-černý strom
Roztáhnout strom
Strom AVLÓ(logn)
k-d strom

Poznámka: Vložení na netříděném poli je někdy uváděno jako Ó(n) vzhledem k předpokladu, že vložený prvek musí být vložen na jednom konkrétním místě pole, což by vyžadovalo posunutí všech následujících prvků o jednu pozici. V klasickém poli se však pole používá k ukládání libovolných netříděných prvků, a proto přesná poloha libovolného daného prvku nemá žádný dopad a vložení se provádí zvětšením velikosti pole o 1 a uložením prvku na konec pole, což je a Ó(1) provoz.[3][4] Podobně je operace mazání někdy citována jako Ó(n) vzhledem k předpokladu, že následující prvky musí být posunuty, ale v klasickém netříděném poli je pořadí nedůležité (i když prvky jsou implicitně seřazeny podle času vložení), takže odstranění lze provést zaměněním prvku, který má být odstraněn, za poslední prvek v poli a poté zmenšení velikosti pole o 1, což je a Ó(1) provoz.[5]

Tato tabulka je pouze přibližným souhrnem; pro každou datovou strukturu existují zvláštní situace a varianty, které mohou vést k různým nákladům. Rovněž lze kombinovat dvě nebo více datových struktur, aby se získaly nižší náklady.

Poznámky pod čarou

  1. ^ A b Cormen, Leiserson, Rivest. Úvod do algoritmů. The College of Information Sciences and Technology at Penn State. ISBN  9780262530910. Spustí se LIST-DELETE Ó(1) čas, ale pokud chcete prvek odstranit daným klíčem, je v nejhorším případě vyžadován Θ (n) čas, protože nejprve musíme zavolat LIST-SEARCH.CS1 maint: používá parametr autoři (odkaz)
  2. ^ A b Cormen, Leiserson, Rivest. Úvod do algoritmů. The College of Information Sciences and Technology at Penn State. ISBN  9780262530910. Existují dva druhy binárních hromad: maximální hromady a minimální hromady. V obou druzích hodnoty v uzlech splňují a halda vlastnost... největší prvek v haldě je uložen v kořenovém adresáři ... Nejmenší prvek v haldě je v kořenovém adresáři ... Operace HEAP-MAXIMUM vrací maximální prvek haldy v čase Θ (1) jednoduchým vrácením hodnoty A[1] v hromadě.CS1 maint: používá parametr autoři (odkaz)
  3. ^ Allen Sherrod (2007). Datové struktury a algoritmy pro vývojáře her. Cengage Learning. ISBN  9781584506638. Vložení položky do neuspořádaného pole nezávisí na ničem jiném než na umístění nové položky na konec seznamu. To dává vložení do neuspořádaného pole Ó(1).
  4. ^ Cormen, Leiserson, Rivest. Úvod do algoritmů. The College of Information Sciences and Technology at Penn State. ISBN  9780262530910.CS1 maint: používá parametr autoři (odkaz)
  5. ^ "Algoritmus - časová složitost vymazání v netříděném poli". Hledání prvku s danou hodnotou je lineární. Vzhledem k tomu, že pole není stejně tříděno, můžete provádět samotné mazání v konstantním čase. Nejprve vyměňte prvek, který chcete odstranit, na konec pole, poté zmenšete velikost pole o jeden prvek.

Viz také