Preference učení - Preference learning

Preference učení je podpole v strojové učení, což je klasifikační metoda založená na pozorovaných informacích o preferencích ^[1]. Z pohledu učení pod dohledem, učení preferencí se trénuje na sadě položek, které mají předvolby pro štítky nebo jiné položky a předpovídají předvolby pro všechny položky.

Zatímco koncept preferenčního učení se již nějakou dobu objevil v mnoha oblastech, jako např ekonomika,^[2] je to relativně nové téma v Umělá inteligence výzkum. V uplynulém desetiletí se na workshopech diskutovalo o preferenčním učení a souvisejících tématech.^[3]

Úkoly

Hlavní úkol v preference učení se týká problémů v "naučit se hodnotit Podle různých pozorovaných informací o preferencích jsou úkoly v knize kategorizovány jako tři hlavní problémy Preference učení:^[4]

Hodnocení štítku

V hodnocení štítků má model prostor instance ${ displaystyle X = {x_ {i} } , !}$ a konečná sada štítků ${ displaystyle Y = {y_ {i} | i = 1,2, cdots, k } , !}$ . Informace o preferencích jsou uvedeny ve formuláři ${ displaystyle y_ {i} succ _ {x} y_ {j} , !}$ označující instanci ${ displaystyle x , !}$ zobrazuje preference v ${ displaystyle y_ {i} , !}$ spíše než ${ displaystyle y_ {j} , !}$ . Jako tréninková data v modelu se používá sada informací o preferencích. Úkolem tohoto modelu je najít pořadí preferencí mezi štítky pro libovolnou instanci.

Bylo pozorováno nějaké konvenční klasifikace problémy lze zobecnit v rámci problému s hodnocením štítků:^[5] pokud je to tréninková instance ${ displaystyle x , !}$ je označen jako třída ${ displaystyle y_ {i} , !}$ , to znamená ${ displaystyle forall j neq i, y_ {i} succ _ {x} y_ {j} , !}$ . V více štítků případ, ${ displaystyle x , !}$ je spojen se sadou štítků ${ displaystyle L subseteq Y , !}$ a tak model může extrahovat sadu informací o preferencích ${ displaystyle {y_ {i} succ _ {x} y_ {j} | y_ {i} v L, y_ {j} v Y zpětné lomítko L } , !}$ . Výcvik modelu předvoleb na základě těchto informací o předvolbách a výsledku klasifikace instance je pouze odpovídající nejvyšší hodnocení.

Pořadí instancí

Pořadí instancí má také prostor instance ${ displaystyle X , !}$ a sada štítků ${ displaystyle Y , !}$ . V této úloze jsou štítky definovány tak, aby měly pevné pořadí ${ displaystyle y_ {1} succ y_ {2} succ cdots succ y_ {k} , !}$ a každá instance ${ displaystyle x_ {l} , !}$ je spojen se štítkem ${ displaystyle y_ {l} , !}$ . Poskytnutím sady instancí jako tréninkových dat je cílem tohoto úkolu najít pořadí pořadí pro novou sadu instancí.

Hodnocení objektu

Hodnocení objektů je podobné hodnocení instancí kromě toho, že k instancím nejsou přidruženy žádné štítky. Ve formuláři je dána sada párových preferenčních informací ${ displaystyle x_ {i} succ x_ {j} , !}$ a model by měl zjistit pořadí mezi instancemi.

Techniky

Existují dvě praktická znázornění informací o preferencích ${ displaystyle A succ B , !}$ . Jeden přiřazuje ${ displaystyle A , !}$ a ${ displaystyle B , !}$ se dvěma reálnými čísly ${ displaystyle a , !}$ a ${ displaystyle b , !}$ respektive takové, že ${ displaystyle a> b , !}$ . Další je přiřazení binární hodnoty ${ displaystyle V (A, B) v {0,1 } , !}$ pro všechny páry ${ displaystyle (A, B) , !}$ označující, zda ${ displaystyle A succ B , !}$ nebo ${ displaystyle B succ A , !}$ . Odpovídající těmto dvěma různým reprezentacím existují dvě různé techniky aplikované na proces učení.

Užitková funkce

Pokud můžeme najít mapování z dat na reálná čísla, lze pořadí dat vyřešit řazením reálných čísel. Toto mapování se nazývá užitková funkce. Pro hodnocení štítků je mapování funkcí ${ displaystyle f: X krát Y rightarrow mathbb {R} , !}$ takhle ${ displaystyle y_ {i} succ _ {x} y_ {j} Rightarrow f (x, y_ {i})> f (x, y_ {j}) , !}$ . Například hodnocení a hodnocení objektů je mapování funkcí ${ displaystyle f: X rightarrow mathbb {R} , !}$ .

Nalezení funkce nástroje je a regrese problém učení, který je dobře vyvinut v strojovém učení.

Preference vztahy

Binární reprezentace informací o preferencích se nazývá preference relace. Pro každou dvojici alternativ (instance nebo štítky) lze binární predikát naučit konvenčním supervizním přístupem k učení. Fürnkranz a Hüllermeier navrhli tento přístup v problému hodnocení štítků.^[6] Pro hodnocení objektů existuje časný přístup Cohen et al.^[7]

Použití preferenčních vztahů k předpovědi hodnocení nebude tak intuitivní. Vzhledem k tomu, že preferenční vztah není tranzitivní, znamená to, že řešení hodnocení uspokojující tyto vztahy by bylo někdy nedosažitelné, nebo by mohlo existovat více než jedno řešení. Běžnějším přístupem je najít hodnotící řešení, které je maximálně v souladu s preferenčními vztahy. Tento přístup je přirozeným rozšířením párové klasifikace.^[6]

Použití

Učení preferencí lze použít při hodnocení výsledků vyhledávání podle zpětné vazby preferencí uživatelů. Vzhledem k dotazu a sadě dokumentů se učící model používá k vyhledání pořadí dokumentů odpovídajících relevanci s tímto dotazem. Další diskuse o výzkumu v této oblasti lze najít v průzkumu Tie-Yan Liu.^[8]

Další aplikací preferenčního učení je doporučující systémy.^[9] Internetový obchod může analyzovat nákupní záznamy zákazníka, zjistit preferenční model a poté zákazníkům doporučit podobné produkty. Poskytovatelé internetového obsahu mohou využít hodnocení uživatelů k poskytnutí obsahu preferovanějšího uživateli.

Viz také

Naučit se hodnotit

Reference

^ Mohri, Mehryar; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). Základy strojového učení. USA, Massachusetts: MIT Press. ISBN 9780262018258.
^ Shogren, Jason F .; List, John A .; Hayes, Dermot J. (2000). „Preference učení v po sobě jdoucích experimentálních aukcích“. American Journal of Agricultural Economics. 82 (4): 1016–1021. doi:10.1111/0002-9092.00099.
^ „Workshopy zaměřené na preference“.
^ Fürnkranz, Johannes; Hüllermeier, Eyke (2011). „Preference Learning: An Introduction“. Preference učení. Springer-Verlag New York, Inc. str. 3–8. ISBN 978-3-642-14124-9.
^ Har-peled, Sariel; Roth, Dan; Zimak, Dav (2003). "Klasifikace omezení pro klasifikaci a hodnocení více tříd". Ve sborníku z 16. výroční konference o systémech zpracování neurálních informací, NIPS-02: 785–792.
^ ^A ^b Fürnkranz, Johannes; Hüllermeier, Eyke (2003). "Párové preference učení a hodnocení". Sborník příspěvků ze 14. evropské konference o strojovém učení: 145–156.
^ Cohen, William W .; Schapire, Robert E .; Singer, Yoram (1998). „Naučit se objednávat věci“. In Proceedings of the 1997 Conference on Advances in Neural Information Processing Systems: 451–457.
^ Liu, Tie-Yan (2009). „Learning to Rank for Information Retrieval“. Základy a trendy v získávání informací. 3 (3): 225–331. doi:10.1561/1500000016.
^ Gemmis, Marco De; Iaquinta, Leo; Lops, Pasquale; Musto, Cataldo; Narducci, Fedelucio; Semeraro, Giovanni (2009). „Výuka preferencí v systémech doporučujících“ (PDF). Preference učení. 41: 387–407. doi:10.1007/978-3-642-14125-6_18. ISBN 978-3-642-14124-9.

externí odkazy

Preference Learning site

[1] Mohri, Mehryar; Rostamizadeh, Afshin; Talwalkar, Ameet (2012). Základy strojového učení. USA, Massachusetts: MIT Press. ISBN 9780262018258.

[SHOG00-2] Shogren, Jason F .; List, John A .; Hayes, Dermot J. (2000). „Preference učení v po sobě jdoucích experimentálních aukcích“. American Journal of Agricultural Economics. 82 (4): 1016–1021. doi:10.1111/0002-9092.00099.

[WEB:WORKSHOP-3] „Workshopy zaměřené na preference“.

[FURN11-4] Fürnkranz, Johannes; Hüllermeier, Eyke (2011). „Preference Learning: An Introduction“. Preference učení. Springer-Verlag New York, Inc. str. 3–8. ISBN 978-3-642-14124-9.

[HARP03-5] Har-peled, Sariel; Roth, Dan; Zimak, Dav (2003). "Klasifikace omezení pro klasifikaci a hodnocení více tříd". Ve sborníku z 16. výroční konference o systémech zpracování neurálních informací, NIPS-02: 785–792.

[FURN03-6] A ^b Fürnkranz, Johannes; Hüllermeier, Eyke (2003). "Párové preference učení a hodnocení". Sborník příspěvků ze 14. evropské konference o strojovém učení: 145–156.

[COHE98-7] Cohen, William W .; Schapire, Robert E .; Singer, Yoram (1998). „Naučit se objednávat věci“. In Proceedings of the 1997 Conference on Advances in Neural Information Processing Systems: 451–457.

[LIU09-8] Liu, Tie-Yan (2009). „Learning to Rank for Information Retrieval“. Základy a trendy v získávání informací. 3 (3): 225–331. doi:10.1561/1500000016.

[GEMM09-9] Gemmis, Marco De; Iaquinta, Leo; Lops, Pasquale; Musto, Cataldo; Narducci, Fedelucio; Semeraro, Giovanni (2009). „Výuka preferencí v systémech doporučujících“ (PDF). Preference učení. 41: 387–407. doi:10.1007/978-3-642-14125-6_18. ISBN 978-3-642-14124-9.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]