Extrahovat, načítat, transformovat - Extract, load, transform
Tento článek obsahuje a seznam doporučení, související čtení nebo externí odkazy, ale její zdroje zůstávají nejasné, protože jí chybí vložené citace.Listopad 2015) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Extrahovat, načítat, transformovat (ELT) je alternativou k extrahovat, transformovat, načíst (ETL) používaný s datové jezero implementace. Na rozdíl od ETL u modelů ELT data není transformován při vstupu do datového jezera, ale uložen v původním nezpracovaném formátu. To umožňuje rychlejší načítání. ELT však vyžaduje dostatečný výpočetní výkon v rámci zpracování dat motor provést transformaci na vyžádání, včas vrátit výsledky. Vzhledem k tomu, že data nejsou zpracovávána při vstupu do datového jezera, není třeba předem definovat dotaz a schéma (i když často bude schéma k dispozici během načítání, protože mnoho zdrojů dat je výňatkem z databází nebo podobných strukturovaných datových systémů, a tedy mít přidružené schéma). ELT jsou data potrubí Modelka.[1]
Komponenty cloudových datových jezer
Společné možnosti úložiště
- AWS
- Blankyt
- GCP
- Úložiště Google (GCS)
Dotazování
Reference
- ^ Načítání datových kanálů pomocí Redshift Spectrum Publikováno deductive.com dne 17. ledna 2018, vyvoláno 3. dubna 2019
externí odkazy
- Dull, Tamara, „Data Lake Debate: Pro is Up first“, smartdatacollective.com, 20. března 2015.
Tento počítačový článek je pahýl. Wikipedii můžete pomoci pomocí rozšiřovat to. |