Apache HBase - Apache HBase
Původní autoři | Powerset |
---|---|
Vývojáři | Softwarová nadace Apache |
První vydání | 28. března 2008 |
Stabilní uvolnění | |
Náhled verze | 2.3.3 / 2. listopadu 2020[1] |
Úložiště | Úložiště HBase |
Napsáno | Jáva |
Operační systém | Cross-platform |
Typ | Distribuovaná databáze |
Licence | Licence Apache 2.0 |
webová stránka | hbase |
HBase je open-source nerelační distribuovaná databáze po vzoru Google Bigtable a napsáno v Jáva. Je vyvinut jako součást Softwarová nadace Apache je Apache Hadoop projekt a běží nad HDFS (Hadoop Distributed File System) nebo Alluxio, poskytující funkce podobné Bigtable pro Hadoop. To znamená, že poskytuje a tolerantní k chybám způsob skladování velkého množství řídký data (malé množství informací zachycených ve velké sbírce prázdných nebo nedůležitých údajů, jako je nalezení 50 největších položek ve skupině 2 miliard záznamů nebo nalezení nenulových položek představujících méně než 0,1% obrovské sbírky).
Funkce HBase nabízí kompresi, provoz v paměti a Bloom filtry na sloupec, jak je uvedeno v původním dokumentu Bigtable.[2] Tabulky v HBase mohou sloužit jako vstup a výstup pro MapReduce úlohy běží v Hadoopu a lze k nim přistupovat prostřednictvím Java API, ale také prostřednictvím ZBYTEK, Avro nebo Šetrnost API brány. HBase je a obchod se širokými sloupci a byl široce přijat kvůli své linii s Hadoop a HDFS. HBase běží na HDFS a je vhodný pro rychlejší operace čtení a zápisu na velkých datových sadách s vysokou propustností a nízkou latencí vstupu / výstupu.
HBase není přímou náhradou za klasiku SQL databáze, nicméně Apache Phoenix projekt poskytuje vrstvu SQL pro HBase stejně jako JDBC ovladač, který lze integrovat do různých analytika a obchodní inteligence aplikace. The Apache Trafodion Projekt poskytuje dotazovací stroj SQL s ODBC a JDBC řidiči a ochrana distribuovaných ACID transakcí napříč více příkazy, tabulkami a řádky, které používají HBase jako modul úložiště.
HBase nyní obsluhuje několik webů založených na datech[3] ale Facebook Platforma pro zasílání zpráv nedávno migrovala z HBase na MyRocks.[4][5] Na rozdíl od relačních a tradičních databází HBase nepodporuje skriptování SQL; místo toho je ekvivalent napsán v Javě a využívá podobnost s aplikací MapReduce.
V řeči Erica Brewera Věta CAP „HBase je systém typu CP.
Dějiny
Apache HBase začal jako projekt společnosti Powerset z potřeby zpracovávat obrovské množství dat pro účely vyhledávání v přirozeném jazyce. Od roku 2010 se jedná o projekt nejvyšší úrovně Apache.
Facebook se rozhodl implementovat svou novou platformu pro zasílání zpráv pomocí HBase v listopadu 2010, ale v roce 2018 migroval z HBase.[4]
Řada 2.2.z je současná stabilní verze, nahrazuje dřívější verze.
Případy použití a produkční nasazení
Podniky, které používají HBase
Následuje seznam významných podniků, které HBase používaly nebo používají:
- 23andMe
- Adobe
- Airbnb používá HBase jako součást svého výpočetního rámce streamů v reálném čase AirStream[6]
- Skupina Alibaba
- Amadeus IT Group, jako jeho hlavní dlouhodobé úložiště DB.
- Bloomberg, pro ukládání dat časové řady
- Facebook používal HBase pro svou platformu pro zasílání zpráv v letech 2010 až 2018
- Flipkart používá HBase pro svůj vyhledávací index[7] a přehledy uživatelů.[8]
- Rozruch
- HubSpot
- Imgur používá HBase k napájení svého systému oznámení[9][10]
- Kakao[11]
- Meesho
- Netflix[12]
- Pinterest[13]
- Zrychlete půjčky
- Bohatá relevance
- Raketové palivo
- Salesforce.com[14]
- Sears
- Sophos, pro některé jejich back-endové systémy.
- Spotify používá HBase jako základnu pro úlohy Hadoop a strojové učení.[15]
- Tuenti používá HBase pro svou platformu pro zasílání zpráv.[16][17]
- Xiaomi
- Yahoo!
Viz také
- NoSQL
- Široký obchod se sloupci
- Bigtable
- Apache Cassandra
- Oracle NOSQL
- Hypertabulka
- Apache Accumulo
- MongoDB
- Projekt Voldemort
- Riak
- Sqoop
- Elasticsearch
- Apache Phoenix
Reference
- ^ A b C d „Apache HBase - stahování Apache HBase“. Citováno 8. prosince 2020.
- ^ Chang a kol. (2006). Bigtable: Distribuovaný úložný systém pro strukturovaná data
- ^ „Apache HBase - Běží na Apache HBase ™“. hbase.apache.org. Citováno 8. dubna 2018.
- ^ A b „Migrace úložiště Messenger pro optimalizaci výkonu“. www.facebook.com. Citováno 5. července 2018.
- ^ Facebook: Proč naše zprávy nové generace vyřadily MySQL Citováno: 17. prosince 2010
- ^ HBaseCon (2. srpna 2016). „Apache HBase na Airbnb“. slideshare.net. Citováno 8. dubna 2018.
- ^ „Indexování vyhledávání téměř v reálném čase“.
- ^ „Je v Hadoopu datová lokalita vždy po vybalení z krabice?“.
- ^ „Proč Imgur upustil MySQL ve prospěch databáze HBase - DZone“. dzone.com. Citováno 8. dubna 2018.
- ^ „Tech Tuesday: Imgur Notifications: From MySQL to HBase - The Imgur Blog“. blog.imgur.com. Citováno 8. dubna 2018.
- ^ Doyung Yoon. „S2Graph: Databáze grafů ve velkém měřítku s HBase“.
- ^ Cheolsoo Park a Ashwin Shankar. „Netflix: Integrace Spark v měřítku Petabyte“.
- ^ Engineering, Pinterest (30. března 2018). „Zlepšení účinnosti zálohování HBase na Pinterestu“. Střední. Citováno 14. dubna 2020.
- ^ „Hbase at Salesforce.com“.
- ^ Josh Baer. „Jak Apache řídí hudební doporučení Spotify“.
- ^ „Skupinový chat Tuenti: jednoduchý, ale složitý“.
- ^ „Tuenti Asyncthrift“.
Bibliografie
- Dimiduk, Nick; Khurana, Amandeep (28. listopadu 2012). HBase v akci (1. vyd.). Manning Publications. p. 350. ISBN 978-1617290527.
- George, Lars (20. září 2011). HBase: The Definitive Guide (1. vyd.). O'Reilly Media. p. 556. ISBN 978-1449396107.
- Jiang, Yifeng (16. srpna 2012). Kuchařka pro správu HBase (1. vyd.). Packt Publishing. p. 332. ISBN 978-1849517140.