Panel nástrojů dat - Data Toolbar
Vývojáři | Služby DataTool |
---|---|
Operační systém | Microsoft Windows |
Typ | Panel nástrojů prohlížeče, Škrábání webu |
webová stránka | www.datatoolbar.com |
Panel nástrojů dat je Škrábání webu počítačový software doplněk do internet Explorer, Mozilla Firefox, a Google Chrome internetové prohlížeče který shromažďuje a převádí strukturovaná data z Web stránky do tabulkového formátu, který lze načíst do souboru tabulkový kalkulátor nebo program pro správu databáze.[1]
Algoritmus
Program implementuje variaci algoritmu shody genetického stromu s ohledem na vnořené seznamy.[2] To znamená, že uvnitř daného webu program rekurzivně prochází jeho větvemi DOM strom, jehož cílem je detekovat vnořené seznamy datových položek odpovídajících formátu zadaného obsahu. Je známo, že tento přístup má několik výhod oproti jednoduchému algoritmu shody řetězců.[3]
Funkce
- Sběr dat a obrázků přímo z aplikace Internet Explorer
- Shromažďování informací ze stránek Podrobnosti propojených s katalogem
- Automatické zpracování vícestránkových katalogů
- Podpora nepravidelných víceřadých katalogů smíchaných s reklamou
Podobné nástroje
- Automatizace kdekoli - Web Extractor je součástí většího automatizačního systému
- Snadný extrakt z webu - Samostatná aplikace, Windows
- Mozenda - Webová služba
- Nový software - Samostatná aplikace, obsahuje agenta, Windows
- Přelstít - Samostatná aplikace a rozšíření pro Firefox
- Studio pro škrábání dat - Samostatná aplikace pro Windows a Chrome Extension
- Diggernaut - Webová platforma se samostatnou aplikací pro Windows, Linux, MacOS a Google Chrome Extension
Zdroje
- ^ „Průvodce předními poskytovateli špičkových produktů a služeb v oblasti hypotečního bankovnictví“. The Journal for Mortgage Banking Professionals. Publikace Zackin. 25 (2): 14. ledna 2011.
- ^ Alberto H. F. Laender, Berthier A. Ribeiro-Neto, Altigran S. da Silva, Juliana S. Teixeira Stručný průzkum nástrojů pro extrakci webových dat Archivováno 06.07.2011 na Wayback Machine ACM SIGMOD Svazek 31, 2. vydání
- ^ Nitin Jindal, Bing Liu Zobecněný algoritmus shody stromu zohledňující vnořené seznamy pro extrakci dat z webu Sborník příspěvků z desáté mezinárodní konference SIAM o dolování dat, 2010