Čistě funkční datová struktura - Purely functional data structure

v počítačová věda, a čistě funkční datová struktura je datová struktura které lze implementovat v čistě funkční jazyk. Hlavní rozdíl mezi libovolnou datovou strukturou a čistě funkční je v tom, že tato je (silně) neměnný. Toto omezení zajišťuje, že datová struktura má výhody neměnných objektů: (plný) vytrvalost, rychlá kopie objektů a bezpečnost nití. Efektivní čistě funkční datové struktury mohou vyžadovat použití líné hodnocení a memorování.

Definice

Trvalé datové struktury mají tu vlastnost, že ponechávají své předchozí verze beze změny. Na druhou stranu, struktury jako pole připustit destruktivní aktualizace,[1] tj. aktualizaci, kterou nelze zrušit. Jakmile program zapíše hodnotu do nějakého indexu pole, jeho předchozí hodnotu již nelze načíst.[Citace je zapotřebí ]

Formálně a Čistě funkční datová struktura je datová struktura, kterou lze implementovat v čistě funkční jazyk, jako Haskell. V praxi to znamená, že datové struktury musí být vytvářeny pouze pomocí perzistentních datových struktur, jako jsou n-tice, typy součtu, typy produktů a základní typy, jako jsou celá čísla, znaky, řetězce. Taková datová struktura je nutně trvalá. Všechny trvalé datové struktury však nejsou čistě funkční.[1]:16 Například a trvalé pole je datová struktura, která je perzistentní a která je implementována pomocí pole, které tedy není čistě funkční.[Citace je zapotřebí ]

V knize Čistě funkční datové struktury„Okasaki porovnává destruktivní aktualizace s mistrovskými kuchařskými noži.[1]:2 Destruktivní aktualizace nelze vrátit zpět, a proto by se neměly používat, pokud není jisté, že předchozí hodnota již není vyžadována. Destruktivní aktualizace však mohou také umožnit účinnost, kterou nelze získat pomocí jiných technik. Například datová struktura používající pole a destruktivní aktualizace může být nahrazena podobnou datovou strukturou, kde je pole nahrazeno a mapa, seznam s náhodným přístupem nebo a vyvážený strom, který připouští čistě funkční implementaci. Ale náklady na přístup se mohou z konstantního času na zvýšit logaritmický čas.[Citace je zapotřebí ]

Zajištění čistě funkční datové struktury

Datová struktura není nikdy ze své podstaty funkční. Například zásobník lze implementovat jako jednotlivě propojený seznam. Tato implementace je čistě funkční, pokud jediné operace na zásobníku vrátí nový zásobník, aniž by se změnil starý zásobník. Pokud však jazyk není čistě funkční, nemusí být běhový systém schopen zaručit neměnnost. To dokládá Okasaki,[1]:9-11 kde ukazuje zřetězení dvou samostatně propojených seznamů lze stále provést pomocí imperativního nastavení.[Citace je zapotřebí ]

Aby bylo zajištěno, že je datová struktura používána čistě funkčním způsobem v nečistém funkčním jazyce, moduly nebo třídy lze použít k zajištění manipulace pouze pomocí autorizovaných funkcí.[Citace je zapotřebí ]

Používání čistě funkčních datových struktur

Jednou z hlavních výzev při přizpůsobování stávajícího kódu použití čistě funkčních datových struktur spočívá ve skutečnosti, že proměnlivé datové struktury poskytují „skryté výstupy“ pro funkce, které je používají. Přepis těchto funkcí na čistě funkční datové struktury vyžaduje přidání těchto datových struktur jako explicitní výstupy.

Zvažte například funkci, která přijímá proměnlivý seznam, vloží prvek do seznamu a vrátí délku nového seznamu. V čistě funkčním nastavení vloží nový prvek do seznamu nový seznam, ale neaktualizuje původní. Aby byla užitečná, čistě funkční verze této funkce pravděpodobně bude muset vrátit délku seznamu i nový seznam samotný. V nejobecnějším případě musí takto převedený program vrátit „stav“ nebo „úložiště“ programu jako další výsledek z každého volání funkce. O takovém programu se říká, že je napsán styl předávání obchodů.

Příklady

Zde je seznam abstraktních datových struktur s čistě funkční implementací:

Návrh a implementace

Ve své knize Čistě funkční datové struktury, počítačový vědec Chris Okasaki popisuje techniky používané k návrhu a implementaci čistě funkčních datových struktur, jejichž malá podmnožina je shrnuta níže.

Lenost a memorování

Líné hodnocení je obzvláště zajímavé v čistě funkčním jazyce[1]:31 protože pořadí vyhodnocení nikdy nezmění výsledek funkce. Proto se líné vyhodnocení přirozeně stává důležitou součástí konstrukce čistě funkčních datových struktur. Umožňuje provádět výpočty, pouze když je skutečně vyžadován jejich výsledek. Proto kód čistě funkční datové struktury může bez ztráty účinnosti zvážit podobně data, která budou efektivně použita, a data, která budou ignorována. Jediný požadovaný výpočet je pro první druh dat, která budou skutečně provedena.[Citace je zapotřebí ]

Jedním z klíčových nástrojů při budování efektivních, čistě funkčních datových struktur je memoizace.[1]:31 Když je výpočet hotový, uloží se a nemusí se provádět podruhé. To je zvláště důležité u líných implementací; další hodnocení mohou vyžadovat stejný výsledek, ale není možné vědět, které hodnocení to bude vyžadovat jako první.[Citace je zapotřebí ]

Amortizovaná analýza a plánování

Některé datové struktury, dokonce i ty, které nejsou čistě funkční, jako např dynamická pole, připustit operace, které jsou většinu času efektivní (tj. konstantní čas pro dynamická pole) a zřídka neúčinné (tj. lineární čas pro dynamická pole). Amortizace pak lze použít k prokázání, že průměrná doba provozu operací je efektivní.[1]:39 To znamená, že několik neefektivních operací je dostatečně vzácných a nemění asymptotický vývoj časové složitosti, když se uvažuje o posloupnosti operací.[Citace je zapotřebí ]

Obecně platí, že neefektivní operace nejsou pro trvalé datové struktury přijatelné, protože právě tuto operaci lze mnohokrát volat. Není přijatelné ani pro systémy v reálném čase, ani pro imperativní systémy, kde může uživatel vyžadovat, aby byl čas předvídatelný operací potřebný. Kromě toho tato nepředvídatelnost komplikuje použití rovnoběžnost.[1]:83[Citace je zapotřebí ]

Aby se těmto problémům předešlo, umožňují některé datové struktury odložit neefektivní provoz - tomu se říká plánování.[1]:84 Jediným požadavkem je, že výpočet neefektivní operace by měl skončit dříve, než je jeho výsledek skutečně potřebný. Konstantní část neefektivní operace se provádí současně s následujícím voláním efektivní operace, takže neefektivní operace je již zcela provedena, když je potřeba, a každá jednotlivá operace zůstává efektivní.[je zapotřebí objasnění ]

Příklad: fronta

Amortizované fronty[1]:65[1]:73 jsou složeny ze dvou samostatně propojených seznamů: přední a zadní zadní. Prvky jsou přidány do zadního seznamu a jsou odstraněny z předního seznamu. Navíc, kdykoli je přední fronta prázdná, zadní fronta se obrátí a stane se přední, zatímco zadní fronta se vyprázdní. Amortizovaná časová složitost každé operace je konstantní. Každá buňka v seznamu je přidána, obrácena a odstraněna maximálně jednou. Aby nedocházelo k neefektivnímu provozu, kdy je zadní seznam obrácen, fronty v reálném čase přidat omezení, že zadní seznam je pouze tak dlouhý jako přední seznam. Aby bylo zajištěno, že zadní seznam bude delší než přední seznam, je přední seznam připojen k zadnímu seznamu a obrácen. Protože tato operace je neefektivní, neprovádí se okamžitě. Místo toho se provádí pro každou z operací. Každá buňka je tedy vypočítána dříve, než je potřeba, a nový přední seznam je zcela vypočítán, než je třeba volat novou neúčinnou operaci.[Citace je zapotřebí ]

Viz také

Reference

  1. ^ A b C d E F G h i j k Čistě funkční datové struktury podle Chris Okasaki, Cambridge University Press, 1998, ISBN  0-521-66350-4

externí odkazy