Apache Impala - Apache Impala
![]() | |
Vývojáři | Softwarová nadace Apache |
---|---|
První vydání | 28.dubna 2013 |
Stabilní uvolnění | 3.3.0 / 22. srpna 2019[1] |
Úložiště | Úložiště impala |
Napsáno | C ++, Jáva |
Operační systém | Cross-platform |
Typ | Relační Hadoop -analytika |
Licence | Licence Apache 2.0 |
webová stránka | impala |
Apache Impala je otevřený zdroj masivně paralelní zpracování (MPP) SQL dotazovací stroj pro data uložená v počítačový cluster běh Apache Hadoop.[2] Impala byla popsána jako open-source ekvivalent Google F1, která inspirovala jeho vývoj v roce 2012.[3]
Popis
Apache Impala je dotazovací stroj, který běží na Apache Hadoop. Projekt byl vyhlášen v říjnu 2012 s veřejností beta test rozdělení[4][5] a stal se obecně dostupným v květnu 2013.[6]
Impala přináší do Hadoopu škálovatelnou technologii paralelních databází, což uživatelům umožňuje vydávat nízkou latenci SQL dotazy na data uložená v HDFS a Apache HBase bez nutnosti pohybu nebo transformace dat. Impala je integrována s Hadoopem a používá stejné formáty souborů a dat, metadata, zabezpečení a rámce pro správu zdrojů, které používají MapReduce, Apache Hive, Apache Pig a další software Hadoop.
Impala je podporována analytiky a datovými vědci, aby prováděli analytiku na datech uložených v Hadoopu přes SQL nebo obchodní inteligence nástroje. Výsledkem je, že rozsáhlé zpracování dat (prostřednictvím MapReduce) a interaktivní dotazy lze provádět na stejném systému pomocí stejných dat a metadat - což eliminuje potřebu migrovat datové sady do specializovaných systémů nebo proprietárních formátů pro provedení analýzy.
Mezi funkce patří:
- Podporuje HDFS a Apache HBase úložný prostor,
- Čte formáty souborů Hadoop, včetně textu, LZO, SequenceFile, Avro, RCFile, a Parkety,
- Podporuje zabezpečení Hadoop (Ověřování pomocí protokolu Kerberos ),
- Jemnozrnná autorizace na základě rolí s Apache Sentry,
- Používá metadata, ODBC ovladač a syntaxe SQL z Apache Hive.
Na začátku roku 2013, a sloupcový formát souboru volala Parkety byl vyhlášen pro architektury včetně Impala.[7]V prosinci 2013 Webové služby Amazon oznámila podporu Impala.[8]Na začátku roku 2014 MapR přidána podpora pro Impala.[9]V roce 2015 byl vyhlášen další formát s názvem Kudu, který Cloudera navrhla darovat Softwarová nadace Apache spolu s Impala.[10]Impala vystudoval projekt nejvyšší úrovně Apache (TLP) dne 28. listopadu 2017.[11]
Viz také
- Apache Drill - podobný open source projekt inspirovaný Dremelem
- Dremel - podobný nástroj od Google
- rychle Otevřený zdrojový dotazovací stroj SQL vytvořený Facebookem a podporovaný Windows Teradata
Reference
- ^ „Verze 3.3.0“. Citováno 23. srpna 2019.
- ^ „Apache Impala“. Citováno 15. září 2017.
- ^ Cade Metz (24. října 2012). „Man Busts Out of Google, Rebuilds Top-Secret Query Machine“. Wired Magazine. Citováno 10. října 2016.
- ^ Larry Digna (24. října 2012). „Cloudera si klade za cíl přinést Hadoopu dotazy v reálném čase, velká data“. Mezi řádky blog. ZDNet. Citováno 20. ledna 2014.
- ^ Andrew Brust (25. října 2012). „Cloudala's Impala přináší Hadoop do SQL a BI“. ZDNet. Citováno 20. ledna 2014.
- ^ Marcel Kornacker, Justin Erickson (1. května 2013). „Cloudera Impala 1.0: Je to tady, je to skutečné, je to již standard pro SQL na Hadoopu“. Archivovány od originál 13. dubna 2014. Citováno 10. dubna 2014.
- ^ „Parkety: sloupové úložiště pro Hadoop“. Webové stránky projektu. 2013. Citováno 20. ledna 2014.
- ^ „Oznámení podpory Impala pomocí Amazon Elastic MapReduce“. Amazon.com. 12. prosince 2013. Citováno 20. ledna 2014.
- ^ „Impala pro MapR“. MapR.com. 2. února 2014. Citováno 10. dubna 2014.
- ^ David Ramel (18. listopadu 2015). „Cloudera daruje velké datové projekty Impala a Kudu společnosti Apache“. Trendy vývoje aplikací. Citováno 10. října 2016.
- ^ „Apache Software Foundation oznamuje Apache® Impala ™ jako projekt nejvyšší úrovně“. 28. listopadu 2017. Citováno 30. listopadu 2017.
externí odkazy
- Apache Impala webové stránky projektu
- Impala GitHub zdrojový kód projektu