Apache Beam - Apache Beam
tento článek obsahuje obsah, který je napsán jako reklama.Leden 2020) (Zjistěte, jak a kdy odstranit tuto zprávu šablony) ( |
Původní autoři | |
---|---|
Vývojáři | Softwarová nadace Apache |
První vydání | 15. června 2016 |
Stabilní uvolnění | 2.25.0 / 23. října 2020[1] |
Úložiště | Úložiště paprsků |
Napsáno | Jáva, Krajta, Jít |
Operační systém | Cross-platform |
Licence | Licence Apache 2.0 |
webová stránka | paprsek |
Apache Beam je otevřený zdroj jednotný programovací model pro definování a provádění zpracování dat potrubí, počítaje v to ETL, šarže a proud (průběžné) zpracování.[2] Beam Pipelines jsou definovány pomocí jednoho z poskytnutých SDK a proveden v jednom z podporovaných paprsků běžci (distribuované zpracování back-endy) včetně Apache Flink, Apache Samza, Apache Spark, a Tok dat Google Cloud.[3]
Dějiny
Apache Beam[3] je jednou z implementací modelu modelu toku dat.[4] Model Dataflow je založen na předchozí práci na distribuovaných abstrakcích zpracování na Googlu, zejména na FlumeJava[5] a Millwheel.[6][7]
Google vydal otevřenou implementaci SDK modelu Dataflow v roce 2014 a prostředí pro provádění datových toků lokálně (nedistribuované) i v Google Cloud Platform servis.
V roce 2016 společnost Google darovala základní sadu SDK i implementaci místního běžce a sadu vstupů a výstupů (datové konektory) pro přístup Google Cloud Platform datové služby pro Softwarová nadace Apache. Další společnosti a členové komunity přispěli běžci pro existující distribuované platformy pro provádění, stejně jako nová IO pro integraci Beam Runners se stávajícími databázemi, obchody klíč-hodnota a systémy zpráv. Navíc nové DSL byly navrženy na podporu specifických potřeb domény nad Beam Modelem[Citace je zapotřebí ].
Časová osa
Verze | Datum vydání |
---|---|
2.25.0 | 2020-10-23 |
2.24.0 | 2020-09-18 |
2.23.0 | 2020-07-29 |
2.22.0 | 2020-06-08 |
2.21.0 | 2020-05-27 |
2.20.0 | 2020-04-15 |
2.19.0 | 2020-02-04 |
2.18.0 | 2020-01-23 |
2.17.0 | 2020-01-06 |
2.16.0 | 2019-10-07 |
2.15.0 | 2019-08-22 |
2.14.0 | 2019-08-01 |
2.13.0 | 2019-05-22 |
2.12.0 | 2019-04-25 |
2.11.0 | 2019-02-26 |
2.10.0 | 2019-02-01 |
2.9.0 | 2018-12-13 |
2.8.0 | 2018-10-29 |
2.7.0 (LTS) | 2018-10-03 |
2.6.0 | 2018-08-08 |
2.5.0 | 2018-06-26 |
2.4.0 | 2018-03-20 |
2.3.0 | 2018-01-30 |
2.2.0 | 2017-12-02 |
2.1.0 | 2017-08-23 |
2.0.0 | 2017-05-17 |
0.6.0 | 2017-03-11 |
0.5.0 | 2017-02-02 |
0.4.0 | 2016-12-29 |
0.3.0 | 2016-10-31 |
0.2.0 | 2016-08-08 |
0.1.0 | 2016-06-15 |
Legenda: Stará verze Starší verze, stále udržovaná Nejnovější verze |
Viz také
Reference
- ^ Apache Beam 2.25.0, vyvoláno 2. listopadu 2020
- ^ Woodie, Alex (22. dubna 2016). „Ambiciózní cíl Apache Beam: Unify Big Data Development“. Datanami. Citováno 4. srpna 2016.
- ^ A b „Cloudový datový tok - dávkové a streamované zpracování dat“.
- ^ Akidau, Tyler; Schmidt, Eric; Whittle, Sam; Bradshaw, Robert; Chambers, Craig; Černyak, Slava; Fernández-Moctezuma, Rafael J .; Lax, Reuven; McVeety, Sam; Mills, Daniel; Perry, Frances (1. srpna 2015). „Model datového toku“ (PDF). Sborník nadace VLDB. 8 (12): 1792–1803. doi:10.14778/2824032.2824076. Citováno 4. srpna 2016.
- ^ Chambers, Craig; Raniwala, Ashish; Perry, Frances; Adams, Stephen; Henry, Robert R .; Bradshaw, Robert; Weizenbaum, Nathan (1. ledna 2010). „FlumeJava: Snadné a efektivní datové paralelní kanály“ (PDF). Sborník z 31. konference ACM SIGPLAN o programování a implementaci programovacích jazyků. ACM: 363–375. doi:10.1145/1806596.1806638. S2CID 14888571. Archivovány od originál (PDF) dne 23. září 2016. Citováno 4. srpna 2016.
- ^ Akidau, Tyler; Whittle, Sam; Balikov, Alex; Bekiroğlu, Kaya; Černyak, Slava; Haberman, Josh; Lax, Reuven; McVeety, Sam; Mills, Daniel; Nordstrom, Paul (27. srpna 2013). "Mlýnské kolo" (PDF). Sborník nadace VLDB. 6 (11): 1033–1044. doi:10.14778/2536222.2536229. Archivovány od originál (PDF) dne 1. února 2016. Citováno 4. srpna 2016.
- ^ Ukazatel, Iane. „Apache Beam chce být uber-API pro velká data“. InfoWorld. Citováno 4. srpna 2016.