Panel nástrojů dat - Data Toolbar

Panel nástrojů dat
VývojářiSlužby DataTool
Operační systémMicrosoft Windows
TypPanel nástrojů prohlížeče, Škrábání webu
webová stránkawww.datatoolbar.com

Panel nástrojů dat je Škrábání webu počítačový software doplněk do internet Explorer, Mozilla Firefox, a Google Chrome internetové prohlížeče který shromažďuje a převádí strukturovaná data z Web stránky do tabulkového formátu, který lze načíst do souboru tabulkový kalkulátor nebo program pro správu databáze.[1]

Algoritmus

Program implementuje variaci algoritmu shody genetického stromu s ohledem na vnořené seznamy.[2] To znamená, že uvnitř daného webu program rekurzivně prochází jeho větvemi DOM strom, jehož cílem je detekovat vnořené seznamy datových položek odpovídajících formátu zadaného obsahu. Je známo, že tento přístup má několik výhod oproti jednoduchému algoritmu shody řetězců.[3]

Funkce

  • Sběr dat a obrázků přímo z aplikace Internet Explorer
  • Shromažďování informací ze stránek Podrobnosti propojených s katalogem
  • Automatické zpracování vícestránkových katalogů
  • Podpora nepravidelných víceřadých katalogů smíchaných s reklamou

Podobné nástroje

Zdroje

  1. ^ „Průvodce předními poskytovateli špičkových produktů a služeb v oblasti hypotečního bankovnictví“. The Journal for Mortgage Banking Professionals. Publikace Zackin. 25 (2): 14. ledna 2011.
  2. ^ Alberto H. F. Laender, Berthier A. Ribeiro-Neto, Altigran S. da Silva, Juliana S. Teixeira Stručný průzkum nástrojů pro extrakci webových dat Archivováno 06.07.2011 na Wayback Machine ACM SIGMOD Svazek 31, 2. vydání
  3. ^ Nitin Jindal, Bing Liu Zobecněný algoritmus shody stromu zohledňující vnořené seznamy pro extrakci dat z webu Sborník příspěvků z desáté mezinárodní konference SIAM o dolování dat, 2010

externí odkazy