Robustní společné filtrování - Robust collaborative filtering - Wikipedia

Robustní společné filtrovánínebo kolaborativní filtrování odolné proti útokům, odkazuje na algoritmy nebo techniky, jejichž cílem je vytvořit společné filtrování odolnější proti snahám o manipulaci, a doufejme, že udrží kvalitu doporučení. Obecně se tyto snahy o manipulaci obvykle týkají útoků šilinků, nazývaných také útoky vkládáním profilů. Kolaborativní filtrování předpovídá hodnocení uživatele položkám tím, že najde podobné uživatele a podívá se na jejich hodnocení, a protože v online systému je možné vytvářet téměř neurčité kopie uživatelských profilů, stane se filtrování spolupráce zranitelným, když se do systému zavede více kopií falešných profilů. Systém. Existuje několik různých přístupů navržených ke zlepšení odolnosti filtrování spolupráce založeného na modelech i na paměti. Robustní techniky filtrování založené na spolupráci jsou však stále aktivní oblastí výzkumu a jejich hlavní aplikace teprve přijdou.

Úvod

Jednou z největších výzev filtrování spolupráce jsou šilinkové útoky. To znamená, že uživatelé se zlými úmysly nebo konkurence mohou do systému záměrně vložit určitý počet falešných profilů (obvykle 1 ~ 5%) takovým způsobem, že mohou ovlivnit kvalitu doporučení nebo dokonce zkreslit předpokládané hodnocení jménem jejich výhod. Některé z hlavních strategií útoku šilinků jsou náhodné útoky, průměrné útoky, útoky na rozjetý vlak a útoky zaměřené na segmenty.

Náhodné útoky vkládají profily, které dávají náhodná hodnocení podmnožině položek; průměrné útoky dávají průměrné hodnocení každé položky.[1] Útoky na rozjetý vlak a segmenty jsou novější a sofistikovanější model útoku. Profily útoku rozjetého vlaku dávají náhodnému hodnocení podmnožině položek a maximální hodnocení velmi populárním položkám ve snaze zvýšit pravděpodobnost, že tyto falešné profily budou mít mnoho sousedů. Útok zaměřený na segment je podobný modelu útoku na rozjetý vlak, ale poskytuje maximální hodnocení položkám, u nichž se očekává, že budou vysoce hodnoceny cílovou skupinou uživatelů, místo aby byly často hodnoceny.[2]

Obecně je známo, že filtrování spolupráce založené na položkách je robustnější než filtrování spolupráce založené na uživatelích. Filtrování spolupráce založené na položkách však stále není zcela imunní vůči útokům na rozjetý vlak a segment.

Robustní společné filtrování obvykle funguje následovně:

  1. Vytvořte model detekce spamu
  2. Postupujte podle pracovního postupu pravidelných společné filtrování systému, ale pouze s využitím údajů o hodnocení uživatelů, kteří nejsou spamem.

Vztahy s uživateli

Rozložení kosinové vzdálenosti pod útoky rozjetého vlaku různých velikostí

Toto je detekční metoda navržená Gao et al. aby bylo filtrování spolupráce založené na paměti robustnější. [3] Některé populární metriky používané při společném filtrování k měření podobnosti uživatelů jsou Pearsonův korelační koeficient, podobnost zájmu a kosinová vzdálenost. (odkazují na Paměťový CF pro definice) Systém doporučení může detekovat útoky využitím skutečnosti, že distribuce těchto metrik se liší, když jsou v systému uživatelé spamu. Protože útoky šilinků nevstřikují pouze jeden falešný profil, ale velké množství podobných falešných profilů, budou mít tito uživatelé spamu neobvykle vysokou podobnost než normální uživatelé.

Celý systém funguje takto. Vzhledem k hodnotící matici běží a algoritmus shlukování založený na hustotě na metrikách vztahů s uživateli k detekci uživatelů spamu a váží 0 uživatelů spamu a váhu 1 běžných uživatelů. To znamená, že systém při výpočtu předpovědí zohlední pouze hodnocení od normálních uživatelů. Zbytek algoritmu funguje úplně stejně jako normální filtrování založené na položkách.

Podle experimentálních výsledků na datech MovieLens tento robustní přístup CF zachovává přesnost ve srovnání s běžnými položkami založenými na CF, ale je stabilnější. Výsledek predikce pro normální posuny CF o 30-40%, když jsou vloženy spamové uživatelské profily, ale tento robustní přístup posune jen o 5-10%.

Reference

  1. ^ Bhaskar Mehta, Thomas Hofmann a Wolfgang Nejdl, Robustní kolaborativní filtrování „RecSys„ 07 Proceedings of the 2007 ACM Conference on recommender Systems, 49-56
  2. ^ Bamshad Mobasher, Robin Burke, Chad Williams a Runa Bhaumik, Analýza a detekce útoků zaměřených na segmenty proti doporučení pro spolupráci Pokroky v těžbě webu a analýze využití webu, 2005, 96-118
  3. ^ Min Gao, Bin Ling, Quan Yuan, Qingyu Xiong a Linda Yang, Robustní přístup ke spolupráci při filtrování založený na vztazích s uživateli pro systémy doporučení, Mathematical Problems in Engineering, sv. 2014, ID článku 162521