Preference učení - Preference learning
Preference učení je podpole v strojové učení, což je klasifikační metoda založená na pozorovaných informacích o preferencích [1]. Z pohledu učení pod dohledem, učení preferencí se trénuje na sadě položek, které mají předvolby pro štítky nebo jiné položky a předpovídají předvolby pro všechny položky.
Zatímco koncept preferenčního učení se již nějakou dobu objevil v mnoha oblastech, jako např ekonomika,[2] je to relativně nové téma v Umělá inteligence výzkum. V uplynulém desetiletí se na workshopech diskutovalo o preferenčním učení a souvisejících tématech.[3]
Úkoly
Hlavní úkol v preference učení se týká problémů v "naučit se hodnotit Podle různých pozorovaných informací o preferencích jsou úkoly v knize kategorizovány jako tři hlavní problémy Preference učení:[4]
Hodnocení štítku
V hodnocení štítků má model prostor instance a konečná sada štítků . Informace o preferencích jsou uvedeny ve formuláři označující instanci zobrazuje preference v spíše než . Jako tréninková data v modelu se používá sada informací o preferencích. Úkolem tohoto modelu je najít pořadí preferencí mezi štítky pro libovolnou instanci.
Bylo pozorováno nějaké konvenční klasifikace problémy lze zobecnit v rámci problému s hodnocením štítků:[5] pokud je to tréninková instance je označen jako třída , to znamená . V více štítků případ, je spojen se sadou štítků a tak model může extrahovat sadu informací o preferencích . Výcvik modelu předvoleb na základě těchto informací o předvolbách a výsledku klasifikace instance je pouze odpovídající nejvyšší hodnocení.
Pořadí instancí
Pořadí instancí má také prostor instance a sada štítků . V této úloze jsou štítky definovány tak, aby měly pevné pořadí a každá instance je spojen se štítkem . Poskytnutím sady instancí jako tréninkových dat je cílem tohoto úkolu najít pořadí pořadí pro novou sadu instancí.
Hodnocení objektu
Hodnocení objektů je podobné hodnocení instancí kromě toho, že k instancím nejsou přidruženy žádné štítky. Ve formuláři je dána sada párových preferenčních informací a model by měl zjistit pořadí mezi instancemi.
Techniky
Existují dvě praktická znázornění informací o preferencích . Jeden přiřazuje a se dvěma reálnými čísly a respektive takové, že . Další je přiřazení binární hodnoty pro všechny páry označující, zda nebo . Odpovídající těmto dvěma různým reprezentacím existují dvě různé techniky aplikované na proces učení.
Užitková funkce
Pokud můžeme najít mapování z dat na reálná čísla, lze pořadí dat vyřešit řazením reálných čísel. Toto mapování se nazývá užitková funkce. Pro hodnocení štítků je mapování funkcí takhle . Například hodnocení a hodnocení objektů je mapování funkcí .
Nalezení funkce nástroje je a regrese problém učení, který je dobře vyvinut v strojovém učení.
Preference vztahy
Binární reprezentace informací o preferencích se nazývá preference relace. Pro každou dvojici alternativ (instance nebo štítky) lze binární predikát naučit konvenčním supervizním přístupem k učení. Fürnkranz a Hüllermeier navrhli tento přístup v problému hodnocení štítků.[6] Pro hodnocení objektů existuje časný přístup Cohen et al.[7]
Použití preferenčních vztahů k předpovědi hodnocení nebude tak intuitivní. Vzhledem k tomu, že preferenční vztah není tranzitivní, znamená to, že řešení hodnocení uspokojující tyto vztahy by bylo někdy nedosažitelné, nebo by mohlo existovat více než jedno řešení. Běžnějším přístupem je najít hodnotící řešení, které je maximálně v souladu s preferenčními vztahy. Tento přístup je přirozeným rozšířením párové klasifikace.[6]
Použití
Učení preferencí lze použít při hodnocení výsledků vyhledávání podle zpětné vazby preferencí uživatelů. Vzhledem k dotazu a sadě dokumentů se učící model používá k vyhledání pořadí dokumentů odpovídajících relevanci s tímto dotazem. Další diskuse o výzkumu v této oblasti lze najít v průzkumu Tie-Yan Liu.[8]
Další aplikací preferenčního učení je doporučující systémy.[9] Internetový obchod může analyzovat nákupní záznamy zákazníka, zjistit preferenční model a poté zákazníkům doporučit podobné produkty. Poskytovatelé internetového obsahu mohou využít hodnocení uživatelů k poskytnutí obsahu preferovanějšího uživateli.
Viz také
Reference
- ^ Mohri, Mehryar; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). Základy strojového učení. USA, Massachusetts: MIT Press. ISBN 9780262018258.
- ^ Shogren, Jason F .; List, John A .; Hayes, Dermot J. (2000). „Preference učení v po sobě jdoucích experimentálních aukcích“. American Journal of Agricultural Economics. 82 (4): 1016–1021. doi:10.1111/0002-9092.00099.
- ^ „Workshopy zaměřené na preference“.
- ^ Fürnkranz, Johannes; Hüllermeier, Eyke (2011). „Preference Learning: An Introduction“. Preference učení. Springer-Verlag New York, Inc. str. 3–8. ISBN 978-3-642-14124-9.
- ^ Har-peled, Sariel; Roth, Dan; Zimak, Dav (2003). "Klasifikace omezení pro klasifikaci a hodnocení více tříd". Ve sborníku z 16. výroční konference o systémech zpracování neurálních informací, NIPS-02: 785–792.
- ^ A b Fürnkranz, Johannes; Hüllermeier, Eyke (2003). "Párové preference učení a hodnocení". Sborník příspěvků ze 14. evropské konference o strojovém učení: 145–156.
- ^ Cohen, William W .; Schapire, Robert E .; Singer, Yoram (1998). „Naučit se objednávat věci“. In Proceedings of the 1997 Conference on Advances in Neural Information Processing Systems: 451–457.
- ^ Liu, Tie-Yan (2009). „Learning to Rank for Information Retrieval“. Základy a trendy v získávání informací. 3 (3): 225–331. doi:10.1561/1500000016.
- ^ Gemmis, Marco De; Iaquinta, Leo; Lops, Pasquale; Musto, Cataldo; Narducci, Fedelucio; Semeraro, Giovanni (2009). „Výuka preferencí v systémech doporučujících“ (PDF). Preference učení. 41: 387–407. doi:10.1007/978-3-642-14125-6_18. ISBN 978-3-642-14124-9.