Online agregace - Online aggregation

Online agregace je technika pro zlepšení interaktivního chování databázové systémy zpracování drahých analytických dotazů. Téměř všechny databáze operace se provádějí v dávkovém režimu, tj. uživatel zadá dotaz a počká, až databáze dokončí zpracování celého dotazu. Naopak pomocí online agregace získá uživatel odhady agregovaný dotaz online, jakmile je zadán dotaz. Například pokud je konečná odpověď 1000, po k sekundách získá uživatel odhady ve formě intervalu spolehlivosti jako [990, 1020] s 95% pravděpodobností. Tato důvěra se neustále zmenšuje, protože systém získává stále více a více vzorků.

Online agregaci navrhli v roce 1997 Hellerstein, Haas a Wang[1] pro dotazy seskupení podle agregace přes jednu tabulku. Později autoři ukázali, jak hodnotit spojení online.[2] V roce 2007 Jermaine et al. navrhl a implementoval prototyp databázového systému s názvem Database-Online (nebo DBO), který vypočítává skupinový agregovaný dotaz přes více tabulek online a hlavně škálovatelným způsobem.[3] Všechny přístupy k použití online agregace náhodný výběr, který je v distribuovaném prostředí netriviální kvůli paradox inspekce teorie odměny za obnovení. V roce 2011 Pansare et al. navrhl a Bayesian model řešení paradoxu inspekce a implementovaná online agregace pro a MapReduce -jako prostředí.[4]

Reference

  1. ^ Hellerstein, Joseph M.; Haas, Peter J.; Wang, Helen J. (červen 1997). "Online agregace". SIGMOD Rec. 26 (2): 171–182. doi:10.1145/253262.253291.
  2. ^ Haas, Peter; Hellerstein, Joseph M. (červen 1999). Msgstr "Zvlnění se připojí pro online agregaci". SIGMOD Rec. 28 (2): 287–298. doi:10.1145/304181.304208.
  3. ^ Jermaine, Chris; Arumugam, Subramanian; Pol, Abhijit; Dobra, Alin (2007). Škálovatelné přibližné zpracování dotazů pomocí enginu DBO. SIGMOD. str. 725–736. doi:10.1145/1247480.1247560. ISBN  9781595936868.
  4. ^ Pansare, Niketan; Borkar, Vinayak; Jermaine, Chris; Condie, Tyson (srpen 2011). „Online agregace pro velké úlohy MapReduce“ (PDF). VLDB.