Databázový stroj - Database engine
A databázový stroj (nebo úložiště motoru) je základní softwarová součást, kterou a Systém pro správu databází (DBMS) používá k vytvářet, číst, aktualizovat a mazat (CRUD) data od a databáze. Většina systémů pro správu databází obsahuje své vlastní aplikační programovací rozhraní (API), která umožňuje uživateli komunikovat se svým základním strojem, aniž by procházel uživatelským rozhraním DBMS.
Pojem „databázový stroj“ se často zaměňuje za „databázový server „nebo„ systém správy databáze “.„ Instance databáze “označuje procesy a paměťové struktury běžícího databázový stroj.
Skladovací motory
Mnoho moderních DBMS podporuje více úložných modulů ve stejné databázi. Například, MySQL podporuje InnoDB stejně jako MyISAM.
Některé úložiště jsou transakční.
název | Licence | Transakční |
---|---|---|
Árie | GPL | Ne |
Sokol | GPL | Ano |
InnoDB | GPL | Ano |
MyISAM | GPL | Ne |
InfiniDB | GPL | Ne |
TokuDB | GPL | Ano |
WiredTiger | GPL | Ano |
XtraDB | GPL | Ano |
RocksDB | BSD | Ano |
Mezi další typy motorů patří:
- Vestavěná databáze motory
- Databáze v paměti motory
Úvahy o návrhu
Informace v databázi se ukládají jako bity rozložené jako datové struktury v úložišti, které lze efektivně číst a zapisovat na dané vlastnosti hardwaru. Samotné úložiště je obvykle navrženo tak, aby splňovalo požadavky různých oblastí, které úložiště ve velké míře využívají, včetně databází. A DBMS v provozu vždy současně využívá několik typů úložišť (např. paměť a externí úložiště) s příslušnými způsoby rozvržení.
V zásadě lze na databázové úložiště pohlížet jako na lineární adresní prostor, kde každý bit dat má v tomto adresním prostoru svoji jedinečnou adresu. V praxi se jako počáteční referenční body uchovává pouze velmi malé procento adres (což také vyžaduje úložiště); k většině dat je přistupováno nepřímo pomocí výpočtů posunutí (vzdálenost v bitech od referenčních bodů) a datových struktur, které efektivně definují přístupové cesty (pomocí ukazatelů) ke všem potřebným datům, optimalizované pro potřebné operace přístupu k datům.
Hierarchie databázového úložiště
Když je databáze v provozu, nachází se současně v několika typech úložišť, tvořících a hierarchie úložiště. Z povahy současných počítačů většina databázové části uvnitř počítače, který je hostitelem DBMS, nachází (částečně replikuje) v nestálém úložišti. Data (části databáze), která se zpracovávají / manipulují, jsou umístěna uvnitř procesoru, případně v mezipaměti procesoru. Tato data jsou čtena z / zapisována do paměti, obvykle prostřednictvím počítače autobus (zatím obvykle nestálé komponenty úložiště). Paměť počítače komunikuje s daty (přenášenými do / z) externího úložiště, obvykle prostřednictvím standardních paměťových rozhraní nebo sítí (např. optický kanál, iSCSI ). A úložné pole, běžná externí paměťová jednotka, má obvykle vlastní hierarchii úložiště, z rychlé mezipaměti, obvykle sestávající z (volatilní a rychlá) DOUŠEK, který je připojen (opět přes standardní rozhraní) k pohonům, případně s různými rychlostmi, jako flash disky a magnetické diskové jednotky (energeticky nezávislé). Jednotky mohou být připojeny k magnetické pásky, na kterém se obvykle mohou nacházet nejméně aktivní části velké databáze, nebo generace zálohování databáze.
V současné době obvykle existuje korelace mezi rychlostí a cenou úložiště, zatímco rychlejší úložiště je obvykle volatilní.
Datové struktury
Datová struktura je abstraktní konstrukce, která vkládá data dobře definovaným způsobem. Efektivní datová struktura umožňuje efektivní manipulaci s daty. Manipulace s daty může zahrnovat vkládání, mazání, aktualizaci a načítání dat v různých režimech. Určitý typ datové struktury může být v určitých operacích velmi účinný a v jiných velmi neúčinný. Typ datové struktury je vybrán při vývoji DBMS, aby co nejlépe splňoval operace potřebné pro typy dat, které obsahuje. Typ datové struktury vybrané pro určitý úkol obvykle také bere v úvahu typ úložiště, ve kterém se nachází (např. Rychlost přístupu, minimální velikost přístupového bloku úložiště atd.). V některých systémech DBMS mají správci databází flexibilitu výběru mezi možnostmi datových struktur tak, aby obsahovala uživatelská data z důvodů výkonu. Někdy mají datové struktury volitelné parametry pro vyladění výkonu databáze.
Databáze mohou ukládat data v mnoha typech datových struktur.[1] Běžné příklady jsou následující:
- objednané / neuspořádané ploché soubory
- hash tabulky
- B + stromy
- ISAM
- hromady
Orientace dat a shlukování
Na rozdíl od konvenční orientace řádků mohou být také relační databáze orientovaný na sloupy nebo korelační způsobem, jakým ukládají data v jakékoli konkrétní struktuře.
Obecně lze dosáhnout podstatného zlepšení výkonu, pokud jsou různé typy databázových objektů, které se obvykle používají společně, uloženy v úložišti v blízkosti a jsou „seskupeny“. To obvykle umožňuje načíst potřebné související objekty z úložiště v minimálním počtu vstupních operací (každá někdy podstatně časově náročná). Klastrování dokonce i pro databáze v paměti poskytuje výhodu výkonu díky běžnému využití velkých mezipamětí pro operace vstupu a výstupu v paměti s podobným výsledným chováním.
Může být například výhodné seskupit záznam „položky“ na skladě se všemi příslušnými záznamy „objednávky“. Rozhodnutí, zda seskupit určité objekty nebo ne, závisí na statistice využití objektů, velikostech objektů, velikostech mezipaměti, typech úložišť atd.
Indexování databáze
Indexování je technika, kterou některé úložiště používají ke zlepšení výkonu databáze. Mnoho typů indexů sdílí společnou vlastnost, kterou snižují potřebu prozkoumat každou položku při spuštění dotazu. Ve velkých databázích to může snížit čas / náklady na dotazy o řádové hodnoty. Nejjednodušší formou indexu je seřazený seznam hodnot, které lze prohledávat pomocí a binární vyhledávání se sousedním odkazem na umístění záznamu, analogicky s indexem v zadní části knihy. Stejná data mohou mít více indexů (databázi zaměstnanců lze indexovat podle příjmení a data pronájmu).
Indexy ovlivňují výkon, ale ne výsledky. Návrháři databází mohou přidávat nebo odebírat indexy beze změny logiky aplikace, což snižuje náklady na údržbu, jak databáze roste a vyvíjí se využití databáze. Rejstříky mohou zrychlit přístup k datům, ale zabírají místo v databázi a musí se aktualizovat při každé změně dat. Indexy proto mohou urychlit přístup k datům, ale zpomalit jejich údržbu. Tyto dvě vlastnosti určují, zda daný index stojí za cenu.
Reference
- ^ Lightstone, S .; Teorey, T .; Nadeau, T. (2007). Návrh fyzické databáze: Průvodce databázovým profesionálem k využívání indexů, zobrazení, úložiště a dalších. Morgan Kaufmann Press. ISBN 978-0-12-369389-1.