Načítání kontradiktorních informací - Adversarial information retrieval
Načítání kontradiktorních informací (kontradiktorní IR) je téma v vyhledávání informací související se strategiemi pro práci se zdrojem dat, kde byla s jeho částí manipulována škodlivě. Úkoly mohou zahrnovat shromažďování, indexování, filtrování, načítání a hodnocení informací z takového zdroje dat. Adversarial IR zahrnuje studium metod detekce, izolace a porážky takové manipulace.
Na webu převládá forma takové manipulace spamování vyhledávače (také známý jako spamdexing), který zahrnuje použití různých technik k narušení činnosti webové vyhledávače, obvykle pro finanční zisk. Příklady spamdexingu jsou link-bombing, komentář nebo doporučující spam, spamové blogy (splogy), škodlivé značkování. Reverzní inženýrství z algoritmy hodnocení, blokování reklam, kliknutí podvod,[1] a filtrování webového obsahu lze také považovat za formy sporů manipulování s daty.[2]
Témata
Témata související s webovým spamem (spamdexing):
- Propojte spam
- Spamování klíčových slov
- Maskování
- Škodlivé označování
- Spam související s blogy, včetně komentář spam, splogs, a ping spam
Další témata:
- Klikněte na podvod detekce
- Reverzní inženýrství vyhledávač je hodnocení algoritmus
- Web filtrování obsahu
- Blokování reklamy
- Tajnost plazení
- Troll (internet)
- Škodlivé označování nebo hlasování ve službě sociální sítě
- Astroturfing
- Sockpuppetry
Dějiny
Pojem „získávání kontradiktorních informací“ poprvé vytvořil v roce 2000 Andrei Broder (poté hlavní vědecký pracovník v Alta Vista ) během plenárního zasedání webu v TREC -9 konference.[3]
Viz také
Reference
- ^ Jansen, B. J. (2007) Klikněte na podvod. Počítač IEEE. 40 (7), 85-86.
- ^ B. Davison, M. Najork a T. Converse (2006), Zpráva o pracovním listu SIGIR: Načítání sporných informací na webu (AIRWeb 2006)
- ^ D. Hawking a N. Craswell (2004), Načítání ve velkém měřítku a vyhledávání na webu (verze s předtiskem) Archivováno 2007-08-29 na Wayback Machine
externí odkazy
- AIRWeb: série workshopů o získávání informací o kontroverzních informacích na webu
- Výzva pro webový spam: soutěž pro výzkumné pracovníky v oblasti detekce nevyžádané pošty na webu
- Datové sady webového spamu: datové sady pro výzkum detekce webového spamu